Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax – Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:

– абсолютное значение (модуль) отклонения варианта от средней арифметической; f– частота.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации – дисперсию.

Дисперсия – средняя из квадратов отклонений вариантов значений признака от их средней величины:

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков – среднее линейное и среднее квадртическое отклонение – не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Коэффициент вариации – наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

Тема 6. Виды и методы анализа рядов динамики

  1. Ряды динамики. Виды рядов динамики.
  2. Основные показатели рядов динамики
  3. Средние показатели рядов динамики

1. Явления общественной жизни, изучаемые социально-экономической статистикой, находятся в непрерывном изменении и развитии. С течением времени – от месяца к месяцу, от года к году – изменяются численность населения и его состав, объем производимой продукции, уровень производительности труда и т. д., поэтому одной из важнейших задач статистики является изучение изменения общественных явлений во времени – процесса их развития, их динамики. Эту задачу статистика решает путем построения и анализа рядов динамики (временных рядов).

Ряд динамики (хронологический, динамический, временной ряд) – это последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития изучаемого явления. Ряд включает два обязательных элемента: время и конкретное значение показателя (уровень ряда).

Каждое числовое значение показателя, характеризующее величину, размер явления, называется уровнем ряда. Кроме уровней каждый ряд динамики содержит указания о тех моментах либо периодах времени, к которым относятся уровни.

При подведении итогов статистического наблюдения получают абсолютные показатели двух видов. Одни из них характеризуют состояние явления на определенный момент времени: наличие на этот момент каких-либо единиц совокупности или наличие того или иного объема признака. К таким показателям относится численность населения, парк автомобилей, жилищный фонд, товарные запасы и т. д. Величину таких показателей можно определить непосредственно только по состоянию на тот или иной момент времени, а потому эти показатели и соответствующие ряды динамики и называются моментными.

Другие показатели характеризуют итоги какого-либо процесса за определенный период (интервал) времени (сутки, месяц, квартал, год и т. п.). Такими показателями являются, например, число родившихся, количество произведенной продукции, ввод в действие жилых домов, фонд заработной платы и др. Величину этих показателей можно подсчитать только за какой-нибудь интервал (период) времени, поэтому такие показатели и ряды их значений называются интервальными.

Каждый уровень интервального ряда уже представляет собой сумму уровней за более короткие промежутки времени. При этом единица совокупности, входящая в состав одного уровня, не входит в состав других уровней, поэтому в интервальном ряду динамики уровни за примыкающие друг к другу периоды времени можно суммировать, получая итоги (уровни) за более продолжительные периоды (так, суммируя месячные уровни, получим квартальные, суммируя квартальные, получим годовые, суммируя годовые – многолетние).

В моментном динамическом ряду одни и те же единицы совокупности обычно входят в состав нескольких уровней, поэтому суммирование уровней моментного ряда динамики само по себе не имеет смысла, так как получающиеся при этом итоги лишены самостоятельной экономической значимости.

При построении и перед анализом ряда динамики нужно прежде всего обратить внимание на то, чтобы уровни ряда были сопоставимы между собой, так как только в этом случае динамический ряд будет правильно отражать процесс развития явления. Сопоставимость уровней ряда динамики – это важнейшее условие обоснованности и правильности выводов, полученных в результате анализа этого ряда. При построении динамического ряда надо иметь в виду, что ряд может охватывать большой период времени, в течение которого могли произойти изменения, нарушающие сопоставимость (территориальные изменения, изменения круга охвата объектов, методологии расчетов и т. д.).

При изучении динамики общественных явлений статистика решает следующие задачи:

Измеряет абсолютную и относительную скорость роста либо снижения уровня за отдельные промежутки времени;

Дает обобщающие характеристики уровня и скорости его изменения за тот или иной период;

Выявляет и численно характеризует основные тенденции развития явлений на отдельных этапах;

Дает сравнительную числовую характеристику развития данного явления в разных регионах или на разных этапах;

Выявляет факторы, обусловливающие изменение изучаемого явления во времени;

Делает прогнозы развития явления в будущем.

2 . Простейшими показателями анализа, которые используются при решении ряда задач, в первую очередь при измерении скорости изменения уровня ряда динамики, являются абсолютный прирост, темпы роста и прироста, а также абсолютное значение (содержание) одного процента прироста. Расчет этих показателей основан на сравнении между собой уровней ряда динамики. При этом уровень, с которым производится сравнение, называется базисным, так как он является базой сравнения. Обычно за базу сравнения принимается либо предыдущий, либо какой-либо предшествующий уровень, например первый уровень ряда.

Если каждый уровень сравнивается с предыдущим, то полученные при этом показатели называются цепными, так как они представляют собой как бы звенья «цепи», связывающей между собой уровни ряда. Если же все уровни связываются с одним и тем же уровнем, выступающим как постоянная база сравнения, то полученные при этом показатели называются базисными.

Часто построение ряда динамики начинают с того уровня, который будет использован в качестве постоянной базы сравнения. Выбор этой базы должен быть обоснован историческими и социально-экономическими особенностями развития изучаемого явления. В качестве базисного целесообразно брать какой-либо характерный, типичный уровень, например конечный уровень предыдущего этапа развития (или средний его уровень, если на предыдущем этапе уровень то повышался, то понижался).

Абсолютный прирост показывает, на сколько единиц увеличился (или уменьшился) уровень по сравнению с базисным, т. е. за тот или иной промежуток (период) времени. Абсолютный прирост равен разности между сравниваемыми уровнями и измеряется в тех же единицах, что и эти уровни:

где уi – уровень i-го года; yi-1 – уровень предшествующего года; y0 – уровень базисного года.

Абсолютный прирост за единицу времени (месяц, год) измеряет абсолютную скорость роста (или снижения) уровня. Цепные и базисные абсолютные приросты связаны между собой: сумма последовательных цепных приростов равна соответствующему базисному приросту, т. е. общему приросту за весь период.

Более полную характеристику роста можно получить только тогда, когда абсолютные величины дополняются относительными. Относительными показателями динамики являются темпы роста и темпы прироста, характеризующие интенсивность процесса роста.

Темп роста (Тр) – статистический показатель, который отражает интенсивность изменения уровней ряда динамики и показывает, во сколько раз увеличился уровень по сравнению с базисным, а в случае уменьшения – какую часть базисного уровня составляет сравниваемый уровень; измеряется отношением текущего уровня к предыдущему или базисному:

Между цепными и базисными темпами роста, выраженными в форме коэффициентов, существует определенная взаимосвязь: произведение последовательных цепных темпов роста равно базисному темпу роста за весь соответствующий период.

Темп прироста (Тпр) характеризует относительную величину прироста, т. е. представляет собой отношение абсолютного прироста к предыдущему или базисному уровню:

Темп прироста, выраженный в процентах, показывает, на сколько процентов увеличился (или уменьшился) уровень по сравнению с базисным, принятым за 100 %.

При анализе темпов развития никогда не следует упускать из виду, какие абсолютные величины – уровни и абсолютные приросты – скрываются за темпами роста и прироста. Нужно, в частности, иметь в виду, что при снижении (замедлении) темпов роста и прироста абсолютный прирост может возрастать.

В связи с этим важно изучать еще один показатель динамики – абсолютное значение (содержание) 1 % прироста, который определяется как результат деления абсолютного прироста на соответствующий темп прироста:

3. С течением времени изменяются не только уровни явлений, но и показатели их динамики – абсолютные приросты и темпы развития, поэтому для обобщающей характеристики развития, для выявления и измерения типичных основных тенденций и закономерностей и решения других задач анализа используются средние показатели временного ряда – средние уровни, средние абсолютные приросты и средние темпы динамики.

При вычислении средних показателей динамики необходимо иметь в виду, что к этим средним показателям полностью относятся общие положения теории средних величин. Это означает прежде всего, что динамическая средняя будет типичной, если она характеризует период с однородными, более или менее стабильными условиями развития явления. Выделение таких периодов – этапов развития – в определенном отношении аналогично группировке. Если же динамическая средняя величина исчислена за период, в течение которого условия развития явления существенно менялись, т. е. период, охватывающий разные этапы развития явления, то такой средней величиной нужно пользоваться с большой осторожностью, дополняя ее средними величинами за отдельные этапы.

Наиболее просто вычисляется средний уровень интервального ряда динамики абсолютных величин с равностоящими уровнями. Расчет производится по формуле простой средней арифметической:

где n – число фактических уровней за последовательные равные отрезки времени.

Для моментного ряда с разностоящими уровнями расчет среднего уровня ряда производится по формуле

Средний абсолютный прирост показывает, на сколько единиц увеличивался или уменьшался уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежемесячно, ежегодно и т. д.). Средний абсолютный прирост характеризует среднюю абсолютную скорость роста (или снижения) уровня и всегда является интервальным показателем. Он вычисляется путем деления общего прироста за весь период на длину этого периода в тех или иных единицах времени:

Расчет среднего абсолютного цепного прироста:

Расчет среднего абсолютного базисного прироста:

где – цепные абсолютные приросты за последовательные промежутки времени; n – число цепных приростов; У0 – уровень базисного периода.

Средний темп роста, выраженный в форме коэффициента, показывает, во сколько раз увеличивается уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежегодно, ежемесячно и т. п.).

Для средних темпов роста и прироста сохраняет силу та же взаимосвязь, которая имеет место между обычными темпами роста и прироста:

Средний темп прироста (или снижения), выраженный в процентах, показывает, на сколько процентов увеличивался (или снижался) уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежегодно, ежемесячно и т. п.). Средний темп прироста характеризует среднюю интенсивность роста, т. е. среднюю относительную скорость изменения уровня.

Из всех показателей вариации среднеквадратическое отклонение в наибольшей степени используется для проведения других видов статистического анализа. Однако среднеквадратическое отклонение дает абсолютную оценку меры разбросанности значений и чтобы понять, насколько она велика относительно самих значений, требуется относительный показатель. Такой показатель называется он коэффициент вариации .

Формула коэффициента вариации:

Данный показатель измеряется в процентах (если умножить на 100%).

В статистике принято, что, если коэффициент вариации

меньше 10%, то степень рассеивания данных считается незначительной,

от 10% до 20% - средней,

больше 20% и меньше или равно 33% - значительной,

значение коэффициента вариации не превышает 33%, то совокупность считается однородной,

если больше 33%, то – неоднородной.

Средние, рассчитанные для однородной совокупности – значимы, т.е. действительно характеризуют эту совокупность, для неоднородной совокупности – незначимы, не характеризуют совокупность из-за значительного разброса значений признака в совокупности.

Возьмем пример с расчетом среднего линейного отклонения.

И график для напоминания

По этим данным рассчитаем: среднее значение, размах вариации, среднее линейное отклонение, дисперсию и стандартное отклонение.

Среднее значение – это обычная средняя арифметическая.

Размах вариации – разница между максимумом и минимумом:

Среднее линейное отклонение считается по формуле:

Дисперсия считается по формуле:

Среднеквадратическое отклонение – квадратный корень из дисперсии:

Расчет сведем в табличку.

Вариация показателя отражает изменчивость процесса или явления. Ее степень может измеряться с помощью нескольких показателей.

    Размах вариации – разница между максимумом и минимумом. Отражает диапазон возможных значений.

    Среднее линейное отклонение – отражает среднее из абсолютных (по модулю) отклонений всех значений анализируемой совокупности от их средней величины.

    Дисперсия – средний квадрат отклонений.

    Среднеквадратическое отклонение – корень из дисперсии (среднего квадрата отклонений).

    Коэффициент вариации – наиболее универсальных показатель, отражающий степень разбросанности значений независимо от их масштаба и единиц измерения. Коэффициент вариации измеряется в процентах и может быть использован для сравнения вариации различных процессов и явлений.

Таким образом, в статистическом анализе существует система показателей, отражающих однородность явлений и устойчивость процессов. Часто показатели вариации не имеют самостоятельного смысла и используются для дальнейшего анализа данных. Исключением является коэффициент вариации, который характеризует однородность данных, что является ценной статистической характеристикой.

Правила построения рядов распределения

Ряды распределения представляют собой простейшую группировку, в которой каждая выделенная группа характеризуется одним показателем.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения.

Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака. Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частностями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частностей равна 1 или 100%.

Правила построения рядов распределения аналогичны правилам построения группировки.

Группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов.

Вторичная группировка, или перегруппировка сгруппированных данных применяется для лучшей характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа.

Термин «вариация» произошел от латинского varito -изменение, колеблемость, различие. Однако не всякое различие называется вариацией. Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов.

Исследование вариации в статистике имеет важное значение, т.к. дает возможность оценить степень воздействия на данный признак других варьирующих признаков. Определение вариации необходимо при организации выборочного наблюдения, построения статистических моделей, разработке материалов экспертных опросов и т.д.



Средняя величина - это обобщающая характеристика признака изучаемой совокупности. Она не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней. Поэтому для характеристики колеблемости признака используют показатели вариации.

Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае.

Колебания отдельных значений характеризуют показатели вариации.

Термин «вариация» произошел от лат. variatio – «изменение, колеблемость, различие». Под вариацией понимают количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Различают вариацию признака: случайную и систематическую.

Систематическая вариация помогает оценить степень зависимости изменений в изучаемом признаке от определяющих ее факторов.

Для характеристики колеблемости признака используется ряд показателей, такие как размах вариации, определяемый как разность между наибольшим (Хмах) и наименьшим(xmjn) значениями вариантов:

Среднее линейное отклонение определяется как средняя арифметическая из отклонений индивидуальных значений от средней без учета знака этих отклонений.

Меру вариации более объективно отражает показатель дисперсии.

Среднее квадратическое отклонение – это мерило надежности средней.

Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах, которые позволяют сравнивать характер рассеивания в различных распределениях. Расчет показателей меры относительного рассеивания осуществляют отношением абсолютного показателя рассеивания к средней арифметической и умножают на 100%.

При помощи группировок, подразделив изучаемую совокупность на группы, однородные по признаку-фактору, можно определить три показателя колеблемости признака в совокупности: общую дисперсию, межгрупповую дисперсию и среднюю из внутригруп-повых дисперсий.

Общая дисперсия характеризует вариацию признака, зависящую от всех условий в изучаемой статистической совокупности.

Межгрупповая дисперсия отражает вариацию изучаемого признака, которая возникает под влиянием признака-фактора, положенного в основу группировки, характеризует колеблемость групповых (частных) средних хi и общей средней хо.

Средняя внутригрупповых дисперсий характеризует случайную вариацию в каждой отдельной группе, возникает под влиянием факторов кроме положенного в основу группировки.

Дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком, и доли единиц, не обладающих им.

22. Показатели вариации: абсолютные и относительные

Вариация – различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

К показателям вариации относятся:

I группа - абсолютные показатели вариации

  • размах вариации
  • среднее линейное отклонение
  • дисперсия
  • среднее квадратическое отклонение

II группа - относительные показатели вариации

  • коэффициент вариации
  • коэффициент осцилляции
  • относительное линейное отклонение

· Для измерения вариации в статистике применяют несколько способов.

· Наиболее простым является расчет показателя размаха вариации Н как разницы между максимальным (X max) и минимальным (X min) наблюдаемыми значениями признака:

· H=X max - X min .

· Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.

· Более строгими характеристиками являются показатели колеблемости относительно среднего уровня признака. Простейший показатель такого типа – среднее линейное отклонение Л как среднее арифметическое значение абсолютных отклонений признака от его среднего уровня:

·

· При повторяемости отдельных значений Х используют формулу средней арифметической взвешенной:

· (Напомним, что алгебраическая сумма отклонений от среднего уровня равна нулю.)

· Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируются, например, состав работающих, ритмичность производства, равномерность поставок материалов, разрабатываются системы материального стимулирования. Но, к сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии.

· Дисперсия признака (s 2) определяется на основе квадратической степенной средней:

· .

· Показатель s, равный , называется средним квадратическим отклонением.

· В общей теории статистики показатель дисперсии является оценкой одноименного показателя теории вероятностей и (как сумма квадратов отклонений) оценкой дисперсии в математической статистике, что позволяет использовать положения этих теоретических дисциплин для анализа социально-экономических процессов.

· Если вариация оценивается по небольшому числу наблюдений, взятых из неограниченной генеральной совокупности, то и среднее значение признака определяется с некоторой погрешностью. Расчетная величина дисперсии оказывается смещенной в сторону уменьшения. Для получения несмещенной оценки выборочную дисперсию, полученную по приведенным ранее формулам, надо умножить на величину n / (n - 1). В итоге при малом числе наблюдений (< 30) дисперсию признака рекомендуется вычислять по формуле

· Обычно уже при n > (15÷20) расхождение смещенной и несмещенной оценок становится несущественным. По этой же причине обычно не учитывают смещенность и в формуле сложения дисперсий.

· Если из генеральной совокупности сделать несколько выборок и каждый раз при этом определять среднее значение признака, то возникает задача оценки колеблемости средних. Оценить дисперсию среднего значения можно и на основе всего одного выборочного наблюдения по формуле

· ,

· где n – объем выборки; s 2 – дисперсия признака, рассчитанная по данным выборки.

· Величина носит название средней ошибки выборки и является характеристикой отклонения выборочного среднего значения признака Х от его истинной средней величины. Показатель средней ошибки используется при оценке достоверности результатов выборочного наблюдения.

· Показатели относительного рассеивания. Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.

· 1. Коэффициентом осцилляции отражает относительную колеблемость крайних значений признака вокруг средней

· .

· 2. Относительное линейное отключение характеризует долю усредненного значения признака абсолютных отклонений от средней величины

· .

· 3. Коэффициент вариации:

·

· является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.

· В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными.

· У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со средним квадратическим отклонением s = 10 лет, «состарилась» еще на 15 лет. Теперь = 30 лет, а среднеквадратическое отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15 × 100= 66,7%), со временем оказывается, таким образом, вполне однородной (10/30 × 100 = 33,3 %).

5.3. Показатели вариации

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения – атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум – это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k – число вариантов значений признака. Частоты удобно заменять частостями – wi. Частость – относительный показатель частоты – может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax – Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели

вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:


– абсолютное значение (модуль) отклонения варианта от средней арифметической; f– частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая – в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации – дисперсию.

Дисперсия (?2) – средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (?) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков – среднее линейное и среднее квадртическое отклонение – не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:


– наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.