Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax – Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:

– абсолютное значение (модуль) отклонения варианта от средней арифметической; f– частота.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации – дисперсию.

Дисперсия – средняя из квадратов отклонений вариантов значений признака от их средней величины:

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков – среднее линейное и среднее квадртическое отклонение – не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Коэффициент вариации – наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

Тема 6. Виды и методы анализа рядов динамики

  1. Ряды динамики. Виды рядов динамики.
  2. Основные показатели рядов динамики
  3. Средние показатели рядов динамики

1. Явления общественной жизни, изучаемые социально-экономической статистикой, находятся в непрерывном изменении и развитии. С течением времени – от месяца к месяцу, от года к году – изменяются численность населения и его состав, объем производимой продукции, уровень производительности труда и т. д., поэтому одной из важнейших задач статистики является изучение изменения общественных явлений во времени – процесса их развития, их динамики. Эту задачу статистика решает путем построения и анализа рядов динамики (временных рядов).

Ряд динамики (хронологический, динамический, временной ряд) – это последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития изучаемого явления. Ряд включает два обязательных элемента: время и конкретное значение показателя (уровень ряда).

Каждое числовое значение показателя, характеризующее величину, размер явления, называется уровнем ряда. Кроме уровней каждый ряд динамики содержит указания о тех моментах либо периодах времени, к которым относятся уровни.

При подведении итогов статистического наблюдения получают абсолютные показатели двух видов. Одни из них характеризуют состояние явления на определенный момент времени: наличие на этот момент каких-либо единиц совокупности или наличие того или иного объема признака. К таким показателям относится численность населения, парк автомобилей, жилищный фонд, товарные запасы и т. д. Величину таких показателей можно определить непосредственно только по состоянию на тот или иной момент времени, а потому эти показатели и соответствующие ряды динамики и называются моментными.

Другие показатели характеризуют итоги какого-либо процесса за определенный период (интервал) времени (сутки, месяц, квартал, год и т. п.). Такими показателями являются, например, число родившихся, количество произведенной продукции, ввод в действие жилых домов, фонд заработной платы и др. Величину этих показателей можно подсчитать только за какой-нибудь интервал (период) времени, поэтому такие показатели и ряды их значений называются интервальными.

Каждый уровень интервального ряда уже представляет собой сумму уровней за более короткие промежутки времени. При этом единица совокупности, входящая в состав одного уровня, не входит в состав других уровней, поэтому в интервальном ряду динамики уровни за примыкающие друг к другу периоды времени можно суммировать, получая итоги (уровни) за более продолжительные периоды (так, суммируя месячные уровни, получим квартальные, суммируя квартальные, получим годовые, суммируя годовые – многолетние).

В моментном динамическом ряду одни и те же единицы совокупности обычно входят в состав нескольких уровней, поэтому суммирование уровней моментного ряда динамики само по себе не имеет смысла, так как получающиеся при этом итоги лишены самостоятельной экономической значимости.

При построении и перед анализом ряда динамики нужно прежде всего обратить внимание на то, чтобы уровни ряда были сопоставимы между собой, так как только в этом случае динамический ряд будет правильно отражать процесс развития явления. Сопоставимость уровней ряда динамики – это важнейшее условие обоснованности и правильности выводов, полученных в результате анализа этого ряда. При построении динамического ряда надо иметь в виду, что ряд может охватывать большой период времени, в течение которого могли произойти изменения, нарушающие сопоставимость (территориальные изменения, изменения круга охвата объектов, методологии расчетов и т. д.).

При изучении динамики общественных явлений статистика решает следующие задачи:

Измеряет абсолютную и относительную скорость роста либо снижения уровня за отдельные промежутки времени;

Дает обобщающие характеристики уровня и скорости его изменения за тот или иной период;

Выявляет и численно характеризует основные тенденции развития явлений на отдельных этапах;

Дает сравнительную числовую характеристику развития данного явления в разных регионах или на разных этапах;

Выявляет факторы, обусловливающие изменение изучаемого явления во времени;

Делает прогнозы развития явления в будущем.

2 . Простейшими показателями анализа, которые используются при решении ряда задач, в первую очередь при измерении скорости изменения уровня ряда динамики, являются абсолютный прирост, темпы роста и прироста, а также абсолютное значение (содержание) одного процента прироста. Расчет этих показателей основан на сравнении между собой уровней ряда динамики. При этом уровень, с которым производится сравнение, называется базисным, так как он является базой сравнения. Обычно за базу сравнения принимается либо предыдущий, либо какой-либо предшествующий уровень, например первый уровень ряда.

Если каждый уровень сравнивается с предыдущим, то полученные при этом показатели называются цепными, так как они представляют собой как бы звенья «цепи», связывающей между собой уровни ряда. Если же все уровни связываются с одним и тем же уровнем, выступающим как постоянная база сравнения, то полученные при этом показатели называются базисными.

Часто построение ряда динамики начинают с того уровня, который будет использован в качестве постоянной базы сравнения. Выбор этой базы должен быть обоснован историческими и социально-экономическими особенностями развития изучаемого явления. В качестве базисного целесообразно брать какой-либо характерный, типичный уровень, например конечный уровень предыдущего этапа развития (или средний его уровень, если на предыдущем этапе уровень то повышался, то понижался).

Абсолютный прирост показывает, на сколько единиц увеличился (или уменьшился) уровень по сравнению с базисным, т. е. за тот или иной промежуток (период) времени. Абсолютный прирост равен разности между сравниваемыми уровнями и измеряется в тех же единицах, что и эти уровни:

где уi – уровень i-го года; yi-1 – уровень предшествующего года; y0 – уровень базисного года.

Абсолютный прирост за единицу времени (месяц, год) измеряет абсолютную скорость роста (или снижения) уровня. Цепные и базисные абсолютные приросты связаны между собой: сумма последовательных цепных приростов равна соответствующему базисному приросту, т. е. общему приросту за весь период.

Более полную характеристику роста можно получить только тогда, когда абсолютные величины дополняются относительными. Относительными показателями динамики являются темпы роста и темпы прироста, характеризующие интенсивность процесса роста.

Темп роста (Тр) – статистический показатель, который отражает интенсивность изменения уровней ряда динамики и показывает, во сколько раз увеличился уровень по сравнению с базисным, а в случае уменьшения – какую часть базисного уровня составляет сравниваемый уровень; измеряется отношением текущего уровня к предыдущему или базисному:

Между цепными и базисными темпами роста, выраженными в форме коэффициентов, существует определенная взаимосвязь: произведение последовательных цепных темпов роста равно базисному темпу роста за весь соответствующий период.

Темп прироста (Тпр) характеризует относительную величину прироста, т. е. представляет собой отношение абсолютного прироста к предыдущему или базисному уровню:

Темп прироста, выраженный в процентах, показывает, на сколько процентов увеличился (или уменьшился) уровень по сравнению с базисным, принятым за 100 %.

При анализе темпов развития никогда не следует упускать из виду, какие абсолютные величины – уровни и абсолютные приросты – скрываются за темпами роста и прироста. Нужно, в частности, иметь в виду, что при снижении (замедлении) темпов роста и прироста абсолютный прирост может возрастать.

В связи с этим важно изучать еще один показатель динамики – абсолютное значение (содержание) 1 % прироста, который определяется как результат деления абсолютного прироста на соответствующий темп прироста:

3. С течением времени изменяются не только уровни явлений, но и показатели их динамики – абсолютные приросты и темпы развития, поэтому для обобщающей характеристики развития, для выявления и измерения типичных основных тенденций и закономерностей и решения других задач анализа используются средние показатели временного ряда – средние уровни, средние абсолютные приросты и средние темпы динамики.

При вычислении средних показателей динамики необходимо иметь в виду, что к этим средним показателям полностью относятся общие положения теории средних величин. Это означает прежде всего, что динамическая средняя будет типичной, если она характеризует период с однородными, более или менее стабильными условиями развития явления. Выделение таких периодов – этапов развития – в определенном отношении аналогично группировке. Если же динамическая средняя величина исчислена за период, в течение которого условия развития явления существенно менялись, т. е. период, охватывающий разные этапы развития явления, то такой средней величиной нужно пользоваться с большой осторожностью, дополняя ее средними величинами за отдельные этапы.

Наиболее просто вычисляется средний уровень интервального ряда динамики абсолютных величин с равностоящими уровнями. Расчет производится по формуле простой средней арифметической:

где n – число фактических уровней за последовательные равные отрезки времени.

Для моментного ряда с разностоящими уровнями расчет среднего уровня ряда производится по формуле

Средний абсолютный прирост показывает, на сколько единиц увеличивался или уменьшался уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежемесячно, ежегодно и т. д.). Средний абсолютный прирост характеризует среднюю абсолютную скорость роста (или снижения) уровня и всегда является интервальным показателем. Он вычисляется путем деления общего прироста за весь период на длину этого периода в тех или иных единицах времени:

Расчет среднего абсолютного цепного прироста:

Расчет среднего абсолютного базисного прироста:

где – цепные абсолютные приросты за последовательные промежутки времени; n – число цепных приростов; У0 – уровень базисного периода.

Средний темп роста, выраженный в форме коэффициента, показывает, во сколько раз увеличивается уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежегодно, ежемесячно и т. п.).

Для средних темпов роста и прироста сохраняет силу та же взаимосвязь, которая имеет место между обычными темпами роста и прироста:

Средний темп прироста (или снижения), выраженный в процентах, показывает, на сколько процентов увеличивался (или снижался) уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежегодно, ежемесячно и т. п.). Средний темп прироста характеризует среднюю интенсивность роста, т. е. среднюю относительную скорость изменения уровня.

Из всех показателей вариации среднеквадратическое отклонение в наибольшей степени используется для проведения других видов статистического анализа. Однако среднеквадратическое отклонение дает абсолютную оценку меры разбросанности значений и чтобы понять, насколько она велика относительно самих значений, требуется относительный показатель. Такой показатель называется он коэффициент вариации .

Формула коэффициента вариации:

Данный показатель измеряется в процентах (если умножить на 100%).

В статистике принято, что, если коэффициент вариации

меньше 10%, то степень рассеивания данных считается незначительной,

от 10% до 20% - средней,

больше 20% и меньше или равно 33% - значительной,

значение коэффициента вариации не превышает 33%, то совокупность считается однородной,

если больше 33%, то – неоднородной.

Средние, рассчитанные для однородной совокупности – значимы, т.е. действительно характеризуют эту совокупность, для неоднородной совокупности – незначимы, не характеризуют совокупность из-за значительного разброса значений признака в совокупности.

Возьмем пример с расчетом среднего линейного отклонения.

И график для напоминания

По этим данным рассчитаем: среднее значение, размах вариации, среднее линейное отклонение, дисперсию и стандартное отклонение.

Среднее значение – это обычная средняя арифметическая.

Размах вариации – разница между максимумом и минимумом:

Среднее линейное отклонение считается по формуле:

Дисперсия считается по формуле:

Среднеквадратическое отклонение – квадратный корень из дисперсии:

Расчет сведем в табличку.

Вариация показателя отражает изменчивость процесса или явления. Ее степень может измеряться с помощью нескольких показателей.

    Размах вариации – разница между максимумом и минимумом. Отражает диапазон возможных значений.

    Среднее линейное отклонение – отражает среднее из абсолютных (по модулю) отклонений всех значений анализируемой совокупности от их средней величины.

    Дисперсия – средний квадрат отклонений.

    Среднеквадратическое отклонение – корень из дисперсии (среднего квадрата отклонений).

    Коэффициент вариации – наиболее универсальных показатель, отражающий степень разбросанности значений независимо от их масштаба и единиц измерения. Коэффициент вариации измеряется в процентах и может быть использован для сравнения вариации различных процессов и явлений.

Таким образом, в статистическом анализе существует система показателей, отражающих однородность явлений и устойчивость процессов. Часто показатели вариации не имеют самостоятельного смысла и используются для дальнейшего анализа данных. Исключением является коэффициент вариации, который характеризует однородность данных, что является ценной статистической характеристикой.

По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:

Определите:

1) размах вариации;

2) средний размер вклада;

3) среднее линейное отклонение;

4) дисперсию;

5) среднее квадратическое отклонение;

6) коэффициент вариации вкладов.

Решение:

Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.

Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.

1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:

Размах вариации размера вклада равен 1000 рублей.

2) Средний размер вклада определим по формуле средней арифметической взвешенной.

Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.

Среднее значение первого интервала будет равно:

второго - 500 и т. д.

Занесём результаты вычислений в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х xf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Итого 400 - 312000

Средний размер вклада в Сбербанке города будет равен 780 рублей:

3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:

Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:

1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).

2. Определяются абсолютные отклонения вариант от средней:

3. Полученные отклонения умножаются на частоты:

4. Находится сумма взвешенных отклонений без учёта знака:

5. Сумма взвешенных отклонений делится на сумму частот:

Удобно пользоваться таблицей расчётных данных:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Итого 400 - - - 81280

Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.

4) Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.

Расчёт дисперсии в интервальных рядах распределения производится по формуле:

Порядок расчёта дисперсии в этом случае следующий:

1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).

2. Находят отклонения вариант от средней:

3. Возводят в квадрат отклонения каждой варианты от средней:

4. Умножают квадраты отклонений на веса (частоты):

5. Суммируют полученные произведения:

6. Полученная сумма делится на сумму весов (частот):

Расчёты оформим в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Итого 400 - - - 23040000

Тема 5

Основные вопросы: 1. Понятие вариации.

2. Показатели вариации.

3. Относительные показатели вариации.

4. Виды дисперсии.

1. Понятие вариации. При изучении совокупности явления нельзя ограничиваться только нахождением средней величины. Средние величины дают обобщенную характеристику варьирующего признака, показывают типичные характеристики для изучаемой совокупности. Однако в средней величине не проявляется степень колеблемости отдельных значений признаков вокруг среднего уровня. В зависимости от однородности в совокупности колеблемость признаков может быть большой или малой. Поэтому возникает необходимость в измерении вариации отдельных вариантов по отношению к средней величине.

Определение : Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Вариация в переводе с латинского означает «колеблемость», «изменчивость», «непостоянство». Предполагая, что большинство социально-экономических явлений и процессов варьируют в некотором масштабе, статистика разработала методологию расчета показателей вариации, которые, в свою очередь, могут быть абсолютными, относительными и средними.

Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называют факторами. Нередко эти факторы действуют в противоположных направлениях и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные, которые на одни единицы совокупности могут оказывать влияние, на другие нет.

Например, вариация оценок студентов на экзамене в вузе вызывается, в частности, различными способностями студентов; временем, затраченным ими на самостоятельную работу; посещаемостью занятий; различием социально-бытовых условий и т.д. Но на оценку могут влиять и какие-либо привходящие, чисто случайные причины, например, временное недомогание.

Вариация, порождаемая существенными факторами, носит систематический характер, то есть наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической. В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи – один как причина, другой как следствие его действия.

Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.


Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации.

2. Показатели вариации. К показателям вариации относятся: размах вариации, среднее линейное (абсолютное) отклонение (с.л.о.), дисперсия, среднее квадратическое отклонение (с.к.о.), коэффициент вариации.

1) Размах вариации – разность между максимальным и минимальным значением признака:

Он характеризует пределы изменения признака.

Средний размах: – это есть средняя арифметическая из ряда размахов, полученных из серии равных по объему наблюдений. Используется в контроле качества.

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.

Простейший показатель такого типа СЛО.

2). Среднее линейное отклонение (СЛО) – представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (учитывает только крайние значения признака и не учитывает все промежуточные).

– СЛО для несгруппированных данных: ,

где – число членов ряда.

Т.е. – СЛО равно средней арифметической из абсолютных отклонений (модулей) признака всех единиц совокупности от средней арифметической.

– СЛО для сгруппированных данных: ,

где – сумма частот вариационного ряда.

В формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль – алгебраическая сумма отклонений вариантов от их средней арифметической.

Поэтому СЛО применяют редко, только в случаях, когда суммирование показателей без учета знаков имеет экономический смысл. Например, анализ состава рабочих, ритмичность производства, оборот внешней торговли.

3) Дисперсия – это средний квадрат отклонений индивидуальных значений от средней арифметической (не имеет единиц измерения).

В общем виде взвешенная дисперсия исчисляется по формуле:

или простая дисперсия:

.

Дисперсия альтернативного признака:

4) Среднее квадратическое отклонение (СКО) ‑ это есть квадратный корень из среднего квадрата отклонений отдельных значений признака от средней арифметической:

– для несгруппированных данных;

– для сгруппированных данных (для вариационного ряда).

3. Относительные показатели вариации (коэффициент вариации). В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией зарплаты, выраженной в рублях.

Для осуществления такого сравнения, а также сравнения колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации – коэффициент вариации (КВ).

КВ – представляет собой выраженное в процентах отношение СКО к средней арифметической.

,

это и есть коэффициент вариации. Это относительная мера вариации и позволяет сравнивать степень варьирования в разных вариационных рядах.

4. Виды дисперсии.

Определение : Дисперсия – это средний квадрат отклонений всех значений признака ряда распределения от средней арифметической.

Свойства дисперсии:

1) Дисперсия постоянной величины равна нулю ();

2) Дисперсия не меняется, если все варианты увеличить или уменьшить на одно и то же число ();

3) Если все варианты умножить на число , дисперсия увеличится в раз ;

4) Дисперсия от средней меньше, чем средний квадрат отклонений от любого числа на – свойство минимальности дисперсии от средней ().

Использование свойств дисперсии позволяет упрощать ее расчеты, особенно в случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы. В этих случаях сначала находят дисперсию от условного нуля, а затем используют 4-е свойство, переходят к дисперсии от средней.

Виды дисперсий для сгруппированных данных, условия их применения в статистических исследованиях.

Если совокупность данных сгруппирована на группы по какому-то признаку, то в этом случае выделяются 3 вида дисперсий:

Общая дисперсия

Назначение сервиса . С помощью сервиса в онлайн режиме определяются следующие показатели:
  • средняя взвешенная, дисперсия, среднеквадратическое отклонение, мода, медиана, размах вариации;
  • квартили, децили, квартильный коэффициент дифференциации, линейный коэффициент вариации, коэффициент вариации;
  • среднее линейное отклонение, коэффициент осцилляции.

Инструкция . Чтобы рассчитать показатели вариации, выберите вид ряда, укажите количество исходных данных. Полученное решение сохраняется в файле Word (). Если предварительно требуется сгруппировать ряд (т.е. построить вариационный ряд), то необходимо воспользоваться онлайн-калькулятором Группировка .

Вид статистического ряда
Пример
X
3.45
3.89
5.00
3.00
2.56
1.71
3.34
4.21
4.85
Дискретный ряд
Пример
X i - X i+1 f
до 20 5
20-25 10
25-30 40
30-35 70
35-40 90
40-45 30
45-50 15
свыше 50 10
Итого 270
Интервальный ряд
Пример
X f
20 5
25 10
30 40
35 70
40 90
45 30
50 15
60 10
Итого 270
Вариационный ряд
Количество строк ",0);">

Проверка гипотезы о виде распределения ряда осуществляется через калькулятор Изучение формы распределения ряда .

Классификация показателей вариации

  1. К абсолютным показателям вариации относятся размах вариации, среднее линейное отклонение, дисперсия и среднеквадратическое отклонение. Вторая группа показателей вычисляется, как отношение абсолютных показателей к средней арифметической (медиане).
  2. Относительными показателями вариации являются коэффициенты осцилляции, вариации, относительное линейное отклонение и др.
Показатель Формула
Средняя арифметическая простая
Мода
Размах вариации R=X max -X min
;
;
Среднее квадратическое отклонение

Числовые характеристики вариационного ряда

Числовые характеристики вариационных рядов вычисляют по данным, полученным в результате наблюдений (статистическим данным), поэтому их называют также статистическими характеристиками или оценками. На практике часто оказывается достаточным знание сводных характеристик вариационных рядов: средних или характеристик положения (центральной тенденции); характеристик рассеяния или вариации (изменчивости); характеристик формы (асимметрии и крутости распределения).
Самой известной и наиболее употребляемой характеристикой любого вариационного ряда является его средняя арифметическая, называемая также выборочным средним . Средняя арифметическая характеризует значения признака, вокруг которого концентрируются наблюдения, т.е. центральную тенденцию распределения. В статистическом анализе кроме средней арифметической, называемой аналитической средней, широко применяют структурные, или порядковые, средние, к которым относятся медиана и мода.
Достоинство медианы как меры центральной тенденции заключается в том, что на нее не влияет изменение крайних членов вариационного ряда, если любой из них, меньший медианы, остается меньше ее, а любой, больший медианы, продолжает быть большее ее. Медиана предпочтительнее средней арифметической для ряда, у которого крайние варианты по сравнению с остальными оказались чрезмерно большими или малыми. Особенность моды как меры центральной тенденции заключается в том, что она также не изменяется при изменении крайних членов ряда, т.е. обладает определенной устойчивостью к вариации признака.

Таблица - Числовые характеристики вариационного ряда

Характеристики положения Среднее арифметическое (выборочное среднее)
Мода Mo = x j , если m j = m max
Me = x k+1 , если n = 2k+1;
Me = (x k + x k+1)/2, еслиn = 2k
Характеристики рассеяния
Выборочная дисперсия
Выборочное среднее квадратичное отклонение
Исправленная дисперсия
Исправленное среднее квадратичное отклонение
Среднее абсолютное отклонение
Вариационный размах R = x max - x min
Квартильный размах R Q = Q в – Q н
Характеристики формы Коэффициент асимметрии
Коэффициент эксцесса

Для получения полного представления о вариационном ряде (определив центральную тенденцию распределения с помощью характеристик положения) далее оценивают рассеяние (вариацию, изменчивость) исследуемого признака вокруг этих величин. Простейшим и, весьма приближенным показателем вариации (изменчивости), является вариационный размах . Размах вариации наиболее полезен, если нужен быстрый и общий взгляд на изменчивость при сравнении большого количества выборок.
Но наибольший интерес представляют меры вариации (рассеяния) наблюдений вокруг средних величин, в частности, вокруг средней арифметической. К таким оценкам относятся выборочная дисперсия и среднее квадратичное отклонение . Выборочная дисперсия обладает одним существенным недостатком: если среднее арифметическое выражается в тех же единицах, что и значения случайной величины, то, согласно определению, дисперсия выражается уже в квадратных единицах. Этого недостатка можно избежать, если использовать в качестве меры вариации признака среднее квадратичное отклонение. При малых объемах выборки дисперсия является смещенной оценкой, поэтому при объемах n ≤ 30 используют исправленную дисперсию и исправленное среднее квадратичное отклонение .
Другой часто используемой характеристикой меры рассеяния признака является коэффициент вариации . Достоинством коэффициента вариации является то, что это безразмерная характеристика, позволяющая сравнивать варьирование несоизмеримых вариационных рядов. Кроме того, чем меньше значение коэффициента вариации, тем однороднее совокупность по изучаемому признаку и типичнее средняя. Совокупности с коэффициентом вариации V> 30-35% принято считать неоднородными.
Наряду с дисперсией используют и среднее абсолютное отклонение . Достоинством среднего линейного отклонения является его размерность, т.к. выражается в тех же единицах, что и значения случайной величины. Дополнительным и простым показателем рассеяния значений признака является квартильный размах. Квартильный размах включает в себя медиану и 50% наблюдений, отражающих центральную тенденцию признака, исключая наименьшие и наибольшие значения.
К характеристикам формы относят коэффициент асимметрии и эксцесс. Если коэффициент асимметрии равен нулю, то распределение имеет симметричную форму. Если распределение асимметрично, одна из ветвей полигона частот имеет более пологий спуск, чем другая. Если асимметрия правосторонняя, то справедливо неравенство:,что означает преимущественное появление в распределении более высоких значений признака. Если асимметрия левосторонняя, то выполняется неравенство: , означающее, что в распределении чаще встречаются более низкие значения. Чем больше значение коэффициента асимметрии, тем более асимметрично распределение (до 0,25 асимметрия незначительная; от 0,25 до 0,5 умеренная; свыше 0,5 – существенная).
Эксцесс является показателем крутости (островершинности) вариационного ряда по сравнению с нормальным распределением. Если эксцесс положителен, то полигон вариационного ряда имеет более крутую вершину. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средней величине. Если эксцесс отрицателен - то полигон имеет более пологую вершину по сравнению с нормальной кривой. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от минимального до максимального значения. Чем больше абсолютная величина эксцесса, тем существеннее распределение отличается от нормального.

Типы вариации

Вариация – колеблемость или изменяемость величин признака у единиц совокупности.
Под вариацией в пространстве понимается колеблемость значений признака по отдельным территориям.
Под вариацией во времени подразумевают изменение значений признака в различные моменты времени. Так, со временем изменяются средняя продолжительность жизни, мнения людей и т.д.

Принципы определения показателей вариации

Для ранжированного ряда показатели вариации определяются по простым формулам (например, средняя величина определяется по формуле средней арифметической простой). Для вариационных рядов показатели вариации определяются по агрегатным формулам (с использованием частот). В этом случае показатели вариации являются взвешенными (например, взвешенная средняя).