Вариация определяет различия в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период (момент времени). Причиной вариации бывают разные условия существования разных единиц совокупности. Например, даже близнецы в процессе жизни приобретают различия в росте, весе, а также в таких признаках, как уровень образования, доход, количество детей и т.д.

Вариация возникает в результате того, что сами значения признака складываются под суммарным влиянием разнообразных условий, которые разным образом сочетаются в каждом отдельном случае. Таким образом, величина любого варианта объективна.

Вариация характерна всем без исключения явлениям природы и общества, кроме законодательно закрепленных нормативных значений отдельных социальных признаков. Исследования вариации в статистике имеют огромное значение, помогают познать сущность изучаемого явления. Нахождение вариации, выяснение ее причин, выявление влияния отдельных факторов дают важную информацию для внедрения научно обоснованных управленческих решений.

Средняя величина дает обобщенную характеристику признака совокупности, но она не раскрывает её строения. Среднее значение не показывает, как располагаются вокруг нее варианты осредненного признака, распределены ли они вблизи средней или отклоняются от нее. Средняя в двух совокупностях может быть одинаковой, но в одном варианте все индивидуальные значения отличаются от нее незначительно, а в другом - эти отличия велики, т.е. в первом случае вариация признака мала, а во втором - велика, это имеет очень важное значение для характеристики значимости средней величины.

Для того, чтобы руководитель организации, управляющий, научный работник могли изучать вариацию и управлять ей, статистикой разработаны специальные методы исследования вариации (система показателей). С их помощью вариация находится, характеризуются ее свойства. К показателям вариации относятся : размах вариации, среднее линейное отклонение, коэффициент вариации.

Вариационный ряд и его формы

Вариационный ряд - это упорядоченное распределение единиц совокупности чаще по возрастающим (реже убывающим) значениям признака и подсчет числа единиц с тем или иным значением признака. Когда численность единиц совокупности большая, ранжированный ряд становится громоздким, его построение занимает длительное время. В такой ситуации вариационный ряд строится с помощью группировки единиц совокупности по значениям изучаемого признака.

Существуют следующие формы вариационного ряда :

  1. Ранжированный ряд представляет собой, перечень отдельных единиц совокупности в порядке возрастания (убывания) изучаемого признака.
  2. Дискретный вариационный ряд - это таблица, состоящая из двух строк или граф: конкретных значений варьирующего признака х и числа единиц совокупности с данным значение f - признака частот. Он строится тогда, когда признак принимает наибольшее число значений.
  3. Интервальный ряд .

Размах вариации определяется как абсолютная величина разности между максимальными и минимальными значениями (вариантами) признака:

Размах вариации показывает только крайние отклонения признака и не отражает отдельных отклонений всех вариантов в ряду. Он характеризует пределы изменения варьирующего признака и зависим от колебаний двух крайних вариантов и абсолютно не связан с частотами в вариационном ряду, т. е. с характером распределения, что придает этой величине, случайный характер. Для анализа вариации нужен показатель, который отражает все колебания вариационного признака и даёт общую характеристику. Простейший показатель такого вида — среднее линейное отклонение.

Информация о средних уровнях исследуемых совокупностей обычно бывает недостаточной для глубокого анализа изучаемого процесса или явления. Необходимо учитывать разброс или вариацию отдельных значений изучаемого признака, которая является важной характеристикой исследуемой совокупности.

Вариацией называется колеблемость, многообразие, изменчивость значения признака у единиц совокупности.

Вариация порождается комплексом условий, действующих на совокупность и ее единицы. Например, вариация оценок на экзамене в вузе порождается, в частности, различными способностями студентов, неодинаковым временем, затрачиваемым ими на самостоятельную работу, различием социально-бытовых условий. Именно вариация и предопределяет необходимость статистики. Если бы все студенты получали одинаковые оценки или, например, семьи имели одинаковые доходы, то необходимость в статистическом исследовании отпала бы.

Измерение вариаций дает возможность оценить степень воздействия на данный признак других варьирующих признаков, установить, какие факторы и в какой степени влияют на смертность населения, финансовое положение предприятий, урожайность зерновых культур и т.п. Определение вариации необходимо при организации выборочного наблюдения, построении статистических моделей, разработке материалов экспертных опросов и во многих других случаях.

Каким же образом статистика дает количественную оценку степени колеблемости признака в совокупности, измеряет вариацию? Для этой цели используют такие показатели, как размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Все эти показатели находят широкое применение в социально-экономической статистике, поэтому рассмотрим их сущностную и логическую основы.

Показатели вариации и способы их расчета

Показатели вариации делятся на две группы: абсолютные и относительные.

К абсолютным показателям относятся размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.

В число относительных показателей вариации входят коэффициент вариации, относительное линейное отклонение и др.

Размах вариации

Этот показатель вычисляется как разность между наибольшим и наименьшим значениями варьирующего признака:

Он показывает, насколько велико различие между единицами совокупности, имеющими самое маленькое (А"т(п) и самое большое значение признака (Хтах). Например, различие между максимальной и минимальной пенсией разных групп населения, уровнем дохода различных категорий работающих или нормами выработки у рабочих определенной специальности или квалификации.

Размах является важной характеристикой вариации, он дает первое общее представление о различии единиц внутри совокупности. Этот показатель выражается в тех именованных числах, в каких выражены значения признака.

Особенность размаха вариации заключается в том, что он зависит лишь от двух крайних значений признака. По этой причине его целесообразно применять в тех случаях, когда особое значение имеет либо минимальный, либо максимальный вариант, т.е. когда размах вариации имеет большое смысловое значение. Например, им определяются пределы, в которых могут колебаться размеры тех или иных параметров деталей; его используют при оценке различного рода рисков. Другая сторона этой особенности заключается в том, что на величину размаха вариации большое влияние оказывает случайность. Так как из статистического ряда берутся только два значения признака, причем крайние в ряду, на размах этих значений могут оказывать влияние причины случайного характера, то и размах вариации может быть зависимым от причин случайного характера.

С отмеченной особенностью связано и то обстоятельство, что показатель размаха вариации не учитывает частот в вариационном ряду распределения.

Показатели вариации и способы их расчета

Понятие вариации

Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называются факторами. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные (случайные), которые на одни единицы совокупности могут оказывать влияние, на другие нет.

Вариация, порождаемая существенными факторами, носит систематический характер, т.е. наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической . В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи - один как причина (фактор), другой как следствие (результат) его действия. Точнее говоря, проявляется зависимость вариации одного признака от вариации другогоили от нескольких других.

Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.

Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией . Следовательно, общая вариация слагается из систематической и случайной вариации. Но систематическая вариация, если между признаками имеется довольно существенная связь, в конце концов пробивает себе дорогу через хаос случайных колебаний вариантов зависимого признака и проявляет себя.

Наличие вариации признаков, изучаемых статистикой явлений, ставит задачу определить меру вариации, ее измерение, найти соответствующие измерители - показатели, характеризующие размеры этой вариации, а также выявить сущность и методы вычисления определяющих ее факторов.

Показатели вариации и способы их расчета

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Средняя применяется в качестве своего рода центра тяжести, вокруг которого происходит колебание, рассеяние значений признака. Исчислив среднюю арифметическую по данным вариационного ряда, мы не знаем о том, как отдельные значения изучаемого признака группируются вокруг средней. Для вариационного ряда важно изучать степень сплоченности всех отдельных значений признака вокруг его среднего значения, степень разбросанности этих значений, степень их колеблемости. Для этого в теории статистики используются показатели вариации.

Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. К относительным показателям вариации относятся: коэффициенты вариации, осцилляции, относительное линейное отклонение и др. Относительные показатели вычисляются как отношение абсолютных показателей вариации к средней величине.

1.Размах вариации (R )представляет собой разность между максимальным (x max ) и минимальным (x min ) значением признака исследуемой совокупности:

.

Размах вариации (амплитуда колебаний) дает лишь самое общее представление о размерах вариации, характеризует предел изменения значений признака в исследуемой совокупности. Этот показатель вариации обладает существенным недостатком: он характеризует только отклонения и не дает представление о распределении отклонений по все совокупности. Его величина определяется двумя крайними значениями признака, в то время как колеблемость последнего в целом складывается из всех его значений. Для анализа вариации необходим показатель, который бы отражал все колебания варьирующего признака и давал обобщенную его характеристику.

2. Среднее линейное отклонение ()– это среднее из абсолютных отклонений значений признака от средней арифметической:

, .

Поскольку сумма отклонений значений признака от средней величины равна нулю, приходится все отклонения брать по модулю.

Таково в среднем линейное отклонение вариантов признака от их средней величины. Если среднее линейное отклонение по сравнению со средней величиной признака небольшое, это свидетельствует о том, что данная совокупность в отношении нашего признака однородна, а средняя – типична. Таким образом, среднее линейное отклонение дает обобщенную характеристику степени колеблемости признака в совокупности.

3. Дисперсия – это среднее из квадратов отклонений индивидуальных значений признака от средней величины:

, .

Математические свойства дисперсии

1) Дисперсия постоянной величины равна нулю:

.

2) Дисперсия не изменится, если все значения признака увеличить или уменьшить на некоторую постоянную величину А.

.

3) Если все значения варьирующего признака разделить (умножить) на одну и ту же величину h , то дисперсия уменьшится (увеличится) в h 2 раз.

, .

4)Средний квадрат отклонений индивидуальных значений признака от любой величины А , отличающейся от средней арифметической (A ≠ ), всегда больше среднего квадрата отклонений, исчисленного от средней арифметической:

или .

Средний квадрат отклонений при этом будет больше на вполне определенную величину – на квадрат разности средней от этой условно взятой величины А , т.е. на .

Другими словами, дисперсия от средней имеет свойство минимальности, т.е. она всегда меньше дисперсий, исчисленных от любых других величин.

или .

В случае когда А приравнивается нулю и, следовательно, отклонения не вычисляются, формула принимает следующий вид:

, или .

4.Среднее квадратическое отклонение находится как корень из дисперсии. Показывает (как и среднее линейное отклонение) на сколько в среднем индивидуальные значения признака отклоняются от средней арифметической:

,
.

5.Коэффициент вариации – это относительный показатель, исчисляемый как отношение среднего квадратического отклонения к средней арифметической:

Считается, что если коэффициент вариации превышает 33%, то совокупность нельзя признать качественно однородной. Если K v ≤ 33%, то можно утверждать, что совокупность более или менее однородна, а следовательно, средняя, рассчитанная по такой совокупности, типична. Необходимость исчисления коэффициента вариации вызвана тем, что показатели вариации в абсолютных величинах, как правило, непосредственно несравнимы.



Таблица 8.1 – Распределение предприятий по объему продаж

Алгоритм расчета показателей вариации следующий:

1) определим размах вариации:

R = 21 – 1 = 20 млн. руб.

2) найдем середину интервалов по исходным данным (x i ) и запишем в табл. 8.2;

3) определим среднее значение по формуле средней арифметической взвешенной, для этого введем графу (x i f i ):

млн. руб.

4) для расчета среднего линейного отклонения введем графы и :

млн. руб.

Таково в среднем отклонение вариантов признака от их средней величины.

5) для расчета дисперсии введем графы и .

Тема 5

Основные вопросы: 1. Понятие вариации.

2. Показатели вариации.

3. Относительные показатели вариации.

4. Виды дисперсии.

1. Понятие вариации. При изучении совокупности явления нельзя ограничиваться только нахождением средней величины. Средние величины дают обобщенную характеристику варьирующего признака, показывают типичные характеристики для изучаемой совокупности. Однако в средней величине не проявляется степень колеблемости отдельных значений признаков вокруг среднего уровня. В зависимости от однородности в совокупности колеблемость признаков может быть большой или малой. Поэтому возникает необходимость в измерении вариации отдельных вариантов по отношению к средней величине.

Определение : Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Вариация в переводе с латинского означает «колеблемость», «изменчивость», «непостоянство». Предполагая, что большинство социально-экономических явлений и процессов варьируют в некотором масштабе, статистика разработала методологию расчета показателей вариации, которые, в свою очередь, могут быть абсолютными, относительными и средними.

Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называют факторами. Нередко эти факторы действуют в противоположных направлениях и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные, которые на одни единицы совокупности могут оказывать влияние, на другие нет.

Например, вариация оценок студентов на экзамене в вузе вызывается, в частности, различными способностями студентов; временем, затраченным ими на самостоятельную работу; посещаемостью занятий; различием социально-бытовых условий и т.д. Но на оценку могут влиять и какие-либо привходящие, чисто случайные причины, например, временное недомогание.

Вариация, порождаемая существенными факторами, носит систематический характер, то есть наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической. В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи – один как причина, другой как следствие его действия.

Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.


Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации.

2. Показатели вариации. К показателям вариации относятся: размах вариации, среднее линейное (абсолютное) отклонение (с.л.о.), дисперсия, среднее квадратическое отклонение (с.к.о.), коэффициент вариации.

1) Размах вариации – разность между максимальным и минимальным значением признака:

Он характеризует пределы изменения признака.

Средний размах: – это есть средняя арифметическая из ряда размахов, полученных из серии равных по объему наблюдений. Используется в контроле качества.

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.

Простейший показатель такого типа СЛО.

2). Среднее линейное отклонение (СЛО) – представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (учитывает только крайние значения признака и не учитывает все промежуточные).

– СЛО для несгруппированных данных: ,

где – число членов ряда.

Т.е. – СЛО равно средней арифметической из абсолютных отклонений (модулей) признака всех единиц совокупности от средней арифметической.

– СЛО для сгруппированных данных: ,

где – сумма частот вариационного ряда.

В формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль – алгебраическая сумма отклонений вариантов от их средней арифметической.

Поэтому СЛО применяют редко, только в случаях, когда суммирование показателей без учета знаков имеет экономический смысл. Например, анализ состава рабочих, ритмичность производства, оборот внешней торговли.

3) Дисперсия – это средний квадрат отклонений индивидуальных значений от средней арифметической (не имеет единиц измерения).

В общем виде взвешенная дисперсия исчисляется по формуле:

или простая дисперсия:

.

Дисперсия альтернативного признака:

4) Среднее квадратическое отклонение (СКО) ‑ это есть квадратный корень из среднего квадрата отклонений отдельных значений признака от средней арифметической:

– для несгруппированных данных;

– для сгруппированных данных (для вариационного ряда).

3. Относительные показатели вариации (коэффициент вариации). В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией зарплаты, выраженной в рублях.

Для осуществления такого сравнения, а также сравнения колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации – коэффициент вариации (КВ).

КВ – представляет собой выраженное в процентах отношение СКО к средней арифметической.

,

это и есть коэффициент вариации. Это относительная мера вариации и позволяет сравнивать степень варьирования в разных вариационных рядах.

4. Виды дисперсии.

Определение : Дисперсия – это средний квадрат отклонений всех значений признака ряда распределения от средней арифметической.

Свойства дисперсии:

1) Дисперсия постоянной величины равна нулю ();

2) Дисперсия не меняется, если все варианты увеличить или уменьшить на одно и то же число ();

3) Если все варианты умножить на число , дисперсия увеличится в раз ;

4) Дисперсия от средней меньше, чем средний квадрат отклонений от любого числа на – свойство минимальности дисперсии от средней ().

Использование свойств дисперсии позволяет упрощать ее расчеты, особенно в случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы. В этих случаях сначала находят дисперсию от условного нуля, а затем используют 4-е свойство, переходят к дисперсии от средней.

Виды дисперсий для сгруппированных данных, условия их применения в статистических исследованиях.

Если совокупность данных сгруппирована на группы по какому-то признаку, то в этом случае выделяются 3 вида дисперсий:

Общая дисперсия

2. Вариация альтернативного признака

3. Виды дисперсий. Правило сложения дисперсий

4. Правило сложения дисперсий для альтернативного признака

Зарегистрированные в процессе статистического наблюдения различия величины признака уотдельных единиц совокупности называются вариацией признака. По степенивариации признака можно судить о процессах развития изучаемых явлений, о типичности средних величин. Дело в том, что средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывая строения совокупности.

Она не показывает, как относительно нее располагаются варианты осредняемого признака — сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но водном случае все индивидуальные значения могут мало отличаться от нее, а в другом - эти отличия могут быть велики, т. е. в одном случае вариация признака мала, а в другом - велика, что имеет большое значение для характеристики надежности средней величины.

Для определения меры вариации признака в статистике исполь-зуются абсолютные и относительные показатели вариации .

К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия, среднее квадрата чес кое отклонение.

Размах вариации (R) является самым простым из абсолютных показателей вариации и представляет собой разность между максимальным и минимальным значениями признака:

где X max - максимальное значение признака в совокупности;

X min - минимальное значение признака в совокупности.

Величина размаха вариации зависит только от крайних значений учитывает всех изменений варьирующего признака в пределах изучаемой совокупности. Поэтому при изучении вариации нельзя ограничиваться расчетом только этого показателя. Для анализа вариации необходимы показатели, дающие обобщенную характер всех колебаний варьирующего признака.

Среднее линейное отклонение является простейшим показате-лем такого типа и представляет собой среднюю величину абсолютных отклонений индивидуальных значений признака от их средней ариф-метической величины.

Среднее линейное отклонение для несгруппированных дан-ных определяется по формуле (5.2):

Среднее линейное отклонение для сгруппированных данных рассчитывается так (5.3):

Следует отметить, что среднее линейное отклонение не всегда улавливает степень вариации значений признака. Поэтому в статисти-ке применяется более чувствительный обобщающий показатель - дисперсия . Дисперсия представляет собой средний квадрат отклоне-ний индивидуальных значений признака от их средней величины. Возведение в квадрат позволяет резко усилить различия в величинах отклонений.


Дисперсия для несгруппированных данных вычисляется по формуле (5.4):

Дисперсия для сгруппированных данных рассчитывается так (5.5):

Для расчета дисперсии применяется также следующая формула (5.6):

Среднее квадратическое отклонение представляет собой ко-рень квадратный из дисперсии (5.7) или (5.8):

Среднее квадратическое отклонение также как и среднее линейное отклонение показывает, на сколько в среднем отличаются индивидуальные значения признака от их среднего значения. Однако величине среднеквадратическое отклонение во всех случаях превыша-ет среднее линейное, так как более чутко реагирует на вариацию. Для симметричных и умеренно асимметричных распределений имеет ме-сто следующее соотношение (5.9):

Размах вариации, среднее линейное отклонение и среднееквад-ратическое отклонение выражаются в именованных числах, т. е. име-ют единицу измерения (такую же, как и значения признака). Поэтому их нельзя непосредственно использовать для сравнения степени ва-риации по одному и тому же признаку в двух группах с разным уров-нем средних, а также для сравнения вариации двух различных призна-ков в одной группе. В этих случаях применяются следующие относи-тельные показатели вариации.

Коэффициент осцилляции (5.10)

Относительное линейное отклонение (линейный коэффициент вариации) (5.11):

Коэффициент вариация (5.12):

Коэффициент вариации позволяет не только получить обоб-щающую характеристику вариации признака в совокупности, но и дает возможность сделать выводы об однородности совокупности.Со-вокупность считается однородной, если коэффициент вариации не превышает 33%.Средние величины, рассчитанные по однородной совокупности, являются ее достаточно надежными характеристиками.

Вариация альтернативного признака

В статистике помимо показателей вариации количественных признаков широко используются показатели вариации качественных признаков (в частности, при проектировании выборочного наблюдения). Вариация альтернативного признака количественно проявляется в значении 0 (нуля) у единиц, которые этим признаком не обладают, или 1 (единицы) у тех, которые данный признак имеют. Пусть р — до-ля единиц в совокупности, обладающих данным признаком, q — доля единиц, не обладающих данным признаком, причем p + q = 1.

Среднее значение альтернативного признака определим по формуле средней арифметической (5.13):

Дисперсия альтернативного признака определяется по формуле (5.14):

Таким образом, средняя величина альтернативного признака равна его доле в данной совокупности, а дисперсия — произведению доли его наличия и доли его отсутствия. Максимальное значение дис-персии альтернативного признака, означающее максимальную неод-нородность совокупности, равно 0,25 при p = q = 0,5.