Под средней величиной в статистике понимается обобщенная количественная характеристика признака в статистической совокупности, выражающая его типичный уровень в конкретных условиях места и времени.

Средняя величина исчисляется по качественно однороднойсовокупности единиц. Различают степенные и структурные средние.

Средняя арифметическаявеличина определяется в случае, когда общий объем изучаемого признака может быть получен, путем суммирования его индивидуальных значений. Средняя арифметическая представляет собой частное от деления общего объема данного признака в изучаемом явлении на число единиц совокупности.

Средняя гармоническая используется, когда имеются индивидуальные значения признака, общий объем явления (w=xf ), но неизвестны веса (f ).

Средняя геометрическая применяется при расчете средних темпов роста.

Средняяквадратическая применяется в тех случаях, когда в исходной информации осредняемые величины представлены квадратичными мерами (например, при расчете средних диаметров труб, стволов деревьев).

Средняя хронологическая применяется для определения среднего уровня в моментном ряду динамики.

Модой дискретного вариационного ряда называется вариант, имеющий наибольшую частоту. Ряды могут быть одно и многомодальными.

Медианой дискретного вариационного ряда называется вариант, делящий ряд на две равные части.

Таблица 3.1 – Формулы расчета средних величин

Наименование средней Простая форма Взвешеннаяформа
Средняя арифметическая = (3.1) = (3.2)
Средняя гармоническая = (3.3) = (3.4)
Средняя квадратическая = (3.5) = (3.6)
Средняя геометрическая = (3.7) = (3.8)
Средняя хронологическая

(3.9)

Мода

(3.10)

Начало модального интервала;

h- длина модального интервала;

Частота модального интервала;

Частота предмодального интервала;

Частота послемодального интервала.

Медиана

(3.11)

Начало медианного интервала;

h - длина медианного интервала;

n - объем совокупности;

Накопленная частота интервала, предшествующего

медианному;

Частота медианного интервала.

Для характеристики колеблемости или рассеяния значений признака применяются абсолютные и относительные показатели вариации.

Размах вариации (R ) представляет собой разность между максимальным и минимальным значениями признака.

Среднее линейное отклонение (L) - это средняя арифметическая из абсолютных значений отклонений отдельных вариант признака от среднего значения.


Дисперсия (σ 2) представляет собой средний квадрат отклонений вариант признака от их средней величины.

Среднее квадратическое отклонение (σ) определяется как корень квадратный из дисперсии.

Относительным показателем колеблемости служит коэффициент вариации , который позволяет судить об интенсивности вариации признака, а, следовательно, и об однородности состава изучаемой совокупности.

Таблица 3.2 – Формулы расчета показателей вариации

Наименование показателя Простая форма Взвешеннаяформа
Размах вариации

R=х max - х min (3.12)

Среднее линейное отклонение L = (3.13) L = (3.14)
Дисперсия = (3.15) (3.16)
Среднее квадратическое отклонение (3.17) (3.18)
Коэффициент вариации

V = или V = (3.19)

Задача 3.1. По данным пяти сельскохозяйственных организаций (приложение А)определить среднюю численность работников, среднегодовую заработную плату на одного работника и показатели вариации численности работников и среднегодовой заработной платы. Сделать вывод.

Методические указания:

Среднюю численность работников на одну организацию и показатели вариации рассчитать как простые формы показателей по формулам, приведенным в таблицах 3.1 и 3.2. Все вспомогательные вычисления провести с использованием макета таблицы3.3.


Таблица 3.3 - Вспомогательная таблица для расчета показателей вариации

численности работников

Организация

Среднегодовая численность работников, чел. Отклонение от средней, чел. Квадрат отклонения
х
1
2
3
4
5
Итого -

Среднегодовую оплату труда работников и показатели вариации оплаты труда определить с использованием взвешенной формы показателей по формулам, приведенным в таблицах 3.1 и 3.2. Расчеты представить в таблице 3.4.

Таблица 3.4 - Вспомогательная таблица для расчета показателей вариации

среднегодовой заработной платы

Организация

Среднегодовая оплата труда работника, тыс. руб. Среднегодовая численность работников, чел Фонд заработной платы, тыс. руб. Отклонение от средней, тыс. руб. Отклонения Общий размер квадрата отклонений
х f х f f f
1
2
3
4
5
Итого - -

Задача 3.3. Поданным таблицы 3.5 определить средний процент рентабельности продаж в организациях за каждый год, абсолютный прирост прибыли и рентабельности по каждойорганизации и в целом по всей совокупности.Сделать вывод.

Таблица 3.5 – Финансовые результаты реализации продукции

Задача 3.4. По даннымтаблицы 3.6 определить среднюю урожайность озимой пшеницы,модальное и медианное значения, показатели вариации. Сделать вывод.

Таблица 3.6 – Распределение организаций по урожайности озимой пшеницы

Группа организаций по урожайности озимой пшеницы, ц/га Число организаций в группе () Среднее значение интервала ()
20,01 – 26,7 6
26,71 – 33,4 9
33,41 – 40,1 11
40,11 – 46,8 13
46,81 – 53,5 6
53,51 – 60,2 5
Итого 50

Задача 3.5. По данным таблицы 3.7 определить среднее число детей на одну семью, модальное и медианное значения. Ряд распределения изобразить графически. Сделать вывод.

Таблица 3.7 – Распределение семей по числу детей


Вопросы для самоподготовки

1. Что понимается под средней величиной в статистике?

2. Условия правильного применения средних величин.

3. Назовите виды и формы средних величин.

4. Что характеризует вариация признака?

5. Показатели вариации и способы их расчета.

РЯДЫ ДИНАМИКИ

Одной из важнейших задач статистики является изучение изменения экономических явлений во времени, путем построения и анализа рядов динамики. Ряд динамики представляет собой численные значения статистического показателя в последовательные моменты или периоды времени.

Графически ряды динамики изображаются линейными, либо столбиковыми диаграммами. По оси абсцисс откладываются показатели времени, а по оси ординат - уровни ряда (либо базисные темпы роста).

Введем условные обозначения:

у i – текущий (сравниваемый) уровень, i =1,2,3,…,n;

у 1 – уровень, принятый за постоянную базу сравнения (обычно начальный);

у п – конечный уровень.

Для характеристики развития явления во времени определяют показатели: абсолютный прирост, темп роста, темп прироста базисным и цепным способом, значение одного процента прироста (таблица 4.1).

Таблица 4.1- Расчет текущих показателей ряда динамики

Показатель

Метод расчета

базисный (с постоянной базой) цепной (с переменной базой)
Абсолютный прирост (А) (4.1) (4.2)
Коэффициент роста (К р) (4.3) (4.4)
Темп роста (Т р) (4.5) (4.6)
Темп прироста (Т пр) (4.7) (4.8)
Абсолютное значение 1 % прироста (Зн.1%)

Зн.1% = 0,01 у i-1 или Зн.1%= (4.9)

Для характеристики интенсивности развития явления за длительный период времени рассчитываются средние показатели динамики (таблица4.2).

Средние показатели динамики исчисляются одинаково для интервальных и моментных рядов, исключение составляет лишь расчет среднего уровня ряда.

Таблица 4.2 – Расчет средних показателей ряда динамики

Показатель Метод расчета
Средний уровень () а) интервального ряда (4.10)
б) моментного ряда с равными интервалами (4.11)
в) моментного ряда с неравными интервалами (4.12)
Средний абсолютный прирост () или (4.13)
Средний коэффициент роста () = или (4.14)
Средний темп роста (), % = · 100 % (4.15)
Средний темп прироста (), % = -100 % или =( -1)·100% (4.16)
Среднее значение 1% прироста, (4.17)

Для выявления тенденции развития в рядах динамики применяют различные методы: укрупнения временных интервалов (периодов); скользящих средних; аналитического выравнивания.

Основным условием построения и анализа ряда динамики является сопоставимость уровней во времени.

К несопоставимости приводит изменение состава или территориальных границ изучаемой совокупности, переход к другим единицам измерения, инфляционные процессы. Несопоставимыми ряды динамики являются и в том случае, если они составлены из неодинаковых по продолжительности времени периодов.

При обнаружении несопоставимости уровней ряда должна применяться процедура смыкания, если невозможен их прямой пересчет.

Смыкание может быть произведено двумя способами.

1 способ. Данные за предшествующие периоды умножаются на коэффициент перехода, который определяется как отношение показателей на тот момент времени, когда произошло изменение условий формирования уровней ряда.

2 способ. Уровень переходного периода принимается для второй части ряда за 100% и от этого уровня определяются соответствующие показатели. При этом получается сопоставимый ряд относительных величин.

Иногда в динамических рядах отсутствуют промежуточные или последующие уровни. Их можно исчислить с помощью методов интерполяции (нахождение промежуточного неизвестного уровня, при наличии известных соседних уровней) и экстраполяции (нахождение уровней за пределами изучаемого ряда, т.е. продление в будущее тенденции, наблюдавшейся в прошлом, или в прошлое на основании текущих уровней).

Пример 4.1 . По имеющимся данным о цене производителей на автомобильный бензин рассчитать показатели ряда динамики. Сделать вывод.

Таблица 4.3 - Расчет показателей ряда динамики

Цена производителей автомобильного бензина, руб./т

Абсолютный прирост, руб.

Коэффициент роста

прироста, %

Значение 1% прироста, руб.

базисный цепной базисный цепной базисный цепной базисный цепной
А б А ц К р б К р ц Т р б Т р ц Т пр б Т пр ц Зн.1%
2006 9159,0 - - - - 100,0 100,0 - - -
2007 10965,0 1806,0 1806,0 1,197 1,197 119,7 119,7 19,7 19,7 91,59
2008 14268,0 5109,0 3303,0 1,558 1,301 155,8 130,1 55,8 30,1 109,65
2009 8963,0 -196,0 -5305,0 0,979 0,628 97,9 62,8 -2,1 -37,2 142,68
2010 13831,0 4672,0 4868,0 1,510 1,543 151,0 154,3 51,0 54,3 89,63
Средние показатели 11437,2 107,16

Вывод: расчеты показали, что средняя цена бензина в динамике за 5 лет составила11437,2 руб. за 1 т. При этом ежегодно наблюдался рост цены в среднем на 1168,0 руб. или на 10,9%.Один процент прироста соответствовал107,16 руб.

Пример 4.2 . Методом аналитического выравнивания определить тенденцию изменения средней цены производителей лука репчатого. Сделать вывод.

Методические указания:

Метод аналитического выравнивания состоит в подборе для данного ряда динамики такой теоретической линии, которая выражает основные черты или закономерности изменения уровней явления. Чаще всего при выравнивании используют линейное уравнение:

= а + bt, (4.18)

где а – свободный член уравнения;

b – коэффициент;

t – порядковый номер года.

Параметры а и b определяют способом наименьших квадратов, решая систему двух нормальных уравнений:

(4.19)

Систему можно упростить, перенеся начало отсчета времени t (начало координат) в середину ряда динамики. Тогда∑t = 0 и система примет вид:

Отсюда получаем:

(4.20)

Заполним вспомогательную таблицу 4.4.

По имеющимся данным найдем параметры «а» и «b» следующим образом:

а = ;b = .

Уравнение прямой примет вид: = 6,53 + 0,49t.

Подставим значения t в уравнение и найдем теоретические (выравненные) уровни средней цены производителей репчатого лука (последний столбец таблицы 4.4).

Таблица 4.4 - Вспомогательная таблица

Год Средняя цена производителей лука репчатого, руб./кг у Номер года t Квадрат номера года t 2 Произведение параметров уt Выравненные значения =а+bt
2002 4,40 -4 16 -17,59 4,57
2003 5,46 -3 9 -16,38 5,06
2004 5,48 -2 4 -10,96 5,55
2005 4,87 -1 1 -4,87 6,04
2006 7,56 0 0 0,00 6,53
2007 8,36 1 1 8,36 7,02
2008 6,70 2 4 13,40 7,51
2009 6,19 3 9 18,58 8,00
2010 9,72 4 16 38,88 8,49
Итого 58,73 0 60 29,41 58,73

Фактические и теоретические уровни цен изобразим на рисунке 4.1.

t =6,53+0,49t

Рисунок 4.1-Динамика средней цены производителей

репчатого лука, руб./кг

Вывод: расчеты показали, что средняя цена лука репчатого за 2002-2010 гг. составила 6,53 руб. за 1 кг. В среднем она ежегодно повышалась на 0,49 руб. На графике наглядно видна четко выраженная тенденция к росту цены исследуемогопродукта.

Пример 4.3. В 2007 г. на предприятии была произведена смена оборудования, что привело к несопоставимости ряда динамики (таблица 4.5). Привести его к сопоставимому виду, применив смыкание динамического ряда. Сделать вывод.

Таблица 4.5 – Динамика объемов производства продукции предприятия

а) 19,7 ∙ 1,0755 = 21,2;

б)

.

Вывод: расчеты показали, что смена оборудования на данном предприятии привела к росту объема производства продукции. При этом в динамике за 6 лет он увеличился на 4,9 млн. руб. или на 23,1 %.

Задача 4.1. Численность работников предприятия на 1.03 составила 315 чел. 6.03 уволилось 4 чел., 12.03 принято 5 чел., 19.03 принято 3 чел., 24.03 уволилось 8 чел., 28.03 принято 2 чел. Определить среднюю численность работников за март месяц.

Задача 4.2. Поголовье коров в сельскохозяйственнойорганизации на 1.01 составляло 800 гол.,15.01 было выбраковано 30 гол., 5.02 переведено из нетелей в основное стадо 55 гол., 24.02 куплено 10 гол., 12.03 продано 15 гол., 21.03 выбраковано 25 гол. Определить среднее поголовье коров за первый квартал.

Задача 4.3. По данным приложенияВ о средней цене производителей на отдельные виды товаров за последние пять лет определить базисные и цепные показатели ряда динамики, показатели динамики в среднем за период. Расчеты представить в табличной форме. Сделать вывод.

Задача 4.4. Выявить общую тенденцию средней цены производителей на отдельные товары по данным приложенияВ, используя прием аналитического выравнивания.Фактические и выравненные (теоретические) уровни динамического ряда изобразить графически. Сделать вывод.

Задача 4.5. Используя взаимосвязь показателей, определить уровни ряда динамики и недостающие в таблице 4.6 базисные показатели динамики по имеющимся данным об урожайности озимой пшеницы.

Таблица 4.6 –Вспомогательная таблица для определения урожайности озимой

пшеницы и недостающих базисных показателей динамики

Урожайность озимой

пшеницы, ц/га

Базисные показатели динамики

Значение 1% прироста, ц/га

абсолютный прирост, ц темп роста, % темп прироста, %
2002 55,1 - - -
2003 - 2,8
2004 110,3
2005
2006 17,1 0,633
2007 121,1
2008 13,5
2009
2010 20,4 0,691

Задача 4.6. Используя взаимосвязь показателей, определить уровни ряда динамики и недостающие в таблице 4.7 цепные показатели динамики среднегодового удоя молока от одной коровы в Краснодарском крае.

Таблица 4.7 - Вспомогательная таблица для определения среднегодового

удоя молока и недостающих цепных показателей динамики

Среднегодовой удой молока от одной коровы, кг

Цепные показатели динамики

Значение 1% прироста,

абсолютный прирост, кг темп роста, % темп прироста, %
2004 2784 - - -
2005 405
2006 110,5
2007
2008 152 37,65
2009 4,2
2010 -1,1

Задача4.7. До 2007 г. в состав производственного объединения входили 20 организаций. В 2007 г. в него влились еще 4 организации, и оно стало объединять 24 организации. Провести смыкание ряда динамики, используя данные таблицы 4.8. Сделать вывод.

Таблица 4.8 –Динамика объема реализации продукции объединения, млн. руб.

Вопросы для самоподготовки

1. Ряды динамики, их элементы, правила построения.Виды рядов динамики.

2. Показатели ряда динамики и порядок их расчета.

3. Приемы выявления основной тенденции развития в рядах динамики.

4. Что понимается под интерполяцией и экстраполяцией ряда динамики?

5. Как проводится смыкание рядов динамики?

При анализе данных статистического наблюдения часто возникает необходимость получить обобщенную характеристику изучаемых процессов и явлений. Одной из важнейших обобщающих характеристик статистического анализа является средняя величина . В средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные действием случайных факторов, и находят выражение общие и закономерные черты, свойственные всей совокупности в целом.

Средняя величина – обобщающий показатель, характеризующий типичный уровень явления в расчете на единицу однородной совокупности. В средних величинах выражается действие общих условий, закономерность изучаемого явления. Метод средних является одним из важнейших статистических методов. Основным условием правильного научного использования средней величины в статистическом анализе является качественная однородность совокупности, по которой исчислена средняя. Поэтому перед исчислением средних величин все единицы совокупности расчленяют на однородные группы, по которым и исчисляют средние. Если не произвести такого расчленения, то в результате можно прийти к результату, который совершенно неправильно будет характеризовать наблюдаемую совокупность. Метод средних неотделим от метода группировок, так как именно группировки обеспечивают качественную однородность исследуемых статистических совокупностей.

Средние величины широко используются при изучении социально-правовых процессов, отражающих результаты деятельности государства, органов и учреждений, общественных структур (например, средние темпы роста и прироста объема преступности или раскрываемости, изменение структуры системы профилактики и др.).

Средние величины, используемые в статистическом анализе можно разделить на два класса: степенные средние и структурные средние.

Степенные средние определяются по формуле:

где х – индивидуальные значения осредняемого признака;

n – число единиц совокупности

z – степень средней.

При подстановке в формулу различных значений z получаем выражения для вычисления различных видов степенных средних:

при z = 1 – средняя арифметическая;

при z = 0 – средняя геометрическая;

при z = -1 – средняя гармоническая;

при z = 2 – средняя квадратическая.

Наиболее распространенным видом степенной средней является средняя арифметическая . Она используется в тех случаях, когда объем осредняемого признака образуется как сумма его значений у отдельных единиц рассматриваемой совокупности.



В зависимости от характера исходных данных средняя арифметическая определяется двумя способами.

Допустим, что количество правонарушений по 10 населенным пунктам региона за определенный период составило: 6000, 5900, 5700, 5600,5400, 5300, 4900, 4500, 3600, 3100. Требуется вычислить среднее количество правонарушений по региону. Для его определения необходимо просуммировать количество правонарушений по всем населенным пунктам и полученную сумму разделить на число населенных пунктов в регионе.

Среднее число правонарушений в регионе составило 5000. Используемая в данном примере формула называется простой средней арифметической . Простой она называется потому, что исчисляется простым суммированием индивидуальных значений признака и делением полученной суммы на объем совокупности. Эта формула применяется в тех случаях, когда исходные данные не сгруппированы (не образованы в группы по какому-то признаку) и каждой единице совокупности соответствует определенное значение признака, либо, когда все частоты (частости) равны между собой.

Если же отдельные значения признака встречаются не один, а несколько, причем неодинаковое число раз, то среднюю величину рассчитывают по формуле взвешенной средней арифметической:

Для исчисления взвешенной средней выполняются следующие последовательные операции: умножения каждого варианта на соответствующую ему частоту, суммирование полученных произведений и деление полученной суммы на сумму частот. Рассмотрим пример применения взвешенной средней арифметической.

Пример 4.1.

Годовая нагрузка 15 судей городского суда, специализирующихся на.рассмотрении гражданских дел различной направленности, составила: 17;42;47;47;50;50;50;63;68;68;75;78;80;80;85. Вычислить среднюю годовую нагрузку на одного судью.

Решение.

В данном примере мы имеем дело с дискретным рядом, причем некоторые варианты ряда повторяются несколько раз, например, 47; 50 и т.д. Следовательно, необходимо для исчисления средней арифметической применить формулу взвешенной средней. Представим ряд в виде таблицы.



Таблица 4.1

Подставим в формулу для исчисления средней арифметической взвешенной значения вариантов (количество гражданских дел) и соответствующие им частоты (количество судей).

Следовательно, средняя годовая нагрузка 15 судей городского суда составляет 60 дел.

Часто вычисление средних величин приходится производить по данным, сгруппированным в виде интервальных рядов распределения, когда значения признака представлены в виде интервалов. Для того, чтобы определить среднюю в интервальном ряду, необходимо перейти от интервального ряда к дискретному путем замены интервалов значений признака их серединами. В закрытом интервале (в котором указаны обе границы – нижняя и верхняя) серединное значение определяется как полусумма значений верхней и нижней границ. Иногда приходится иметь дело с открытыми интервалами (в которых имеется лишь одна из границ – верхняя или нижняя). В этом случае предполагается, что ширина данного интервала (расстояние между границами интервала) такая же, как и у соседнего интервала. После перехода от интервального ряда к дискретному вычисление средней производится по формуле взвешенной средней арифметической.

Рассмотрим пример исчисления средней арифметической для интервального ряда.

Пример 4.2.

Сроки рассмотрения уголовных дел районным судом характеризуются следующим образом:

до 3-х дней – 360 дел;

от 3-х до 5-ти дней – 190 дел;

от 5-ти до 10-ти дней – 70 дел;

от 10-ти до 20-ти дней – 170 дел.

Определить средний срок рассмотрения дела.

Решение.

Занесем статистические данные в таблицу 4.2. Для этого представим их в виде интервального ряда. При этом первый интервал будет открытым – до 3-х дней, у него нет нижней границы. Поэтому при нахождении середины данного интервала следует принимать его величину равной величине последующего интервала: 3-5 лет. Таким образом, открытый интервал до 3-х лет будет аналогичен закрытому интервалу 1-3 года и его середина будет равна 2-м годам. Для облегчения исчисления взвешенной средней рекомендуем предварительные вычисления заносить в таблицу, в нашем случае это произведение вариантов на частоты – последний столбец.

Таблица 2

Теперь воспользуемся формулой для исчисления взвешенной средней арифметической:

дней

Как уже было отмечено выше, вторая группа средних, применяемых в статистическом анализе – структурные средние . Их используют для характеристики структуры совокупности. К структурным средним относятся такие показатели, как мода и медиана .

Модой (Мо) называется значение признака (вариант), который наиболее часто встречается в исходной совокупности.

В дискретном вариационном ряду Мо является вариант, имеющий наибольшую частоту. Рассмотрим порядок определения моды на примере:

Пример 4.3.

При обследовании 500 уголовных дел по групповым преступлениям установлены следующие их размеры по количеству членов группы – таблица 4.3.

Таблица 4.3

Решение.

Модальной величиной в данном примере будет преступная группа, состоящая из 4 человек (Мо = 4), поскольку этому значению в дискретном ряду распределения соответствует наибольшее количество уголовных дел – 250 (именно этот вариант имеет наибольшую частоту).

Для определения моды в интервальном ряду распределения сначала находят модальный интервал (интервал, которому соответствует максимальная частота), а затем моду вычисляют по формуле:

где х 0 – нижняя граница модального интервала;

h – ширина модального интервала;

f Mo – частота модального интервала;

f Mo -1 – частота интервала, предшествующего модальному;

f Mo +1 – частота интервала, следующего за модальным.

Пример 4.4 .

105 уголовных дел по конкретному виду преступлений за год распределились по срокам расследования следующим образом – таблица 4.4. Найти моду.

Таблица 4.4

Решение.

Наибольшей частотой в данном случае является 50 (дел), следовательно, модальный интервал будет 3-4 месяца.

Воспользуемся формулой для нахождения моды в интервальном ряду и подставим необходимые значения:

Следовательно, чаще всего встречающийся срок расследования уголовных преступлений за год составил 3,5 месяца.

Медиана - это значение признака, занимающее центральное место в ранжированной совокупности, при этом первая половина совокупности имеет значение признака меньше, чем медиана, а вторая имеет значения признака больше, чем медиана.

Для определения медианы в дискретном вариационном ряду необходимо:

1) Вычислить накопленные частоты.

2) Определить порядковый номер медианы по формуле:

3) По накопленным частотам найти значение признака, которое имеет единица совокупности с найденным порядковым номером.

Пример 4.5.

Распределение уголовных дел по срокам рассмотрения представлены в таблице 4.5. Вычислить медианное значение срока рассмотрения дел.

Таблица 4.5

Решение.

Сначала необходимо вычислить накопленные частоты – таблица 4.5, столбец 3. Находим такое значение накопленной частоты, которое равно или первый раз превышает значение 200: . Этому значению соответствует накопленная частота, равная 260-ти, следовательно, медианой ряда сроков заседаний является срок продолжительностью 4 дня (Ме = 4).

Для того, чтобы найти медиану в интервальном ряду распределения, необходимо:

1) Вычислить накопленные частоты;

2) Определить порядковый номер медианы, используя ту же формулу, что и для дискретного вариационного ряда;

3) По накопленным частотам найти интервал, содержащий нужную нам единицу совокупности (медианный интервал);

4) Вычислить медиану по формуле:

где х 0 – нижняя граница медианного интервала;

h – ширина медианного интервала;

f M е – частота медианного интервала;

– накопленная частота интервала, предшествующего медианному;

Пример 4.6

Для иллюстрации нахождения медианы в интервальном ряду возьмем условие примера 4.4.

Решение.

Сначала необходимо вычислить накопленные частоты. Воспользуемся, как и в предыдущих примерах, табличной формой записи – таблица 4.6.

Таблица 4.6

Затем находим порядковый номер медианы:

Первая накопленная частота, равная или превышающая половину частот ряда (порядковый номер медианы) – это 85 (см. табл. 4.6). Следовательно, медианный интервал в данном случае «3-4 месяца».

Воспользуемся формулой для нахождения медианы в интервальном ряду:

Медианное значение срока расследования составляет 3,35 месяца, т.е. первая половина уголовных дел была расследована менее, чем за 3,35 месяца, а вторая половина дел – более, чем за 3,35 месяца.

Средняя величина дает обобщающую характеристику варьирующего признака. Однако в ряде случаев этого бывает недостаточно и возникает потребность в исследовании вариации (колебаний), которые не проявляются в средней величине.

Изучая результаты статистического наблюдения того или иного признака у конкретных единиц совокупности, практически всегда можно отметить различие между ними.

В процессе статистического исследования того или иного количественного признака отдельные единицы наблюдения могут существенно различаться между собой даже в пределах однородной совокупности. Наблюдаемые различия индивидуальных значений признака внутри изучаемой совокупности в статистике принято называть вариацией признака.

Средние величины двух или более совокупностей могут быть одинаковыми, но при этом исследуемые совокупности существенно различаются величиной вариации, т.е. в одной совокупности отдельные варианты могут далеко отстоять от средней величины, а в другой - размещаться более кучно вокруг средней. В том случае, когда значения признака имеют большое колебание, как правило, можно говорить и о большем разнообразии тех условий, которые воздействовали на исследуемую совокупность.

Если отдельные варианты наблюдаемой статистической совокупности недалеко отстоят от средней величины, то можно говорить, что данная средняя величина достаточно полно отражает изучаемую совокупность, но при этом сама средняя величина ничего не говорит о возможной вариации исследуемого признака.

Изучение характера и меры возможной случайной вариации распределения признаков в исследуемой совокупности является одним из ключевых разделов статистики.

Вариация свойственна практически всем без исключения природным и общественным явлениям и процессам, в том числе и в юридической сфере.

Для измерения величины вариации признака в совокупности используют следующие показатели размера вариации:

§ размах вариации,

§ среднее линейное отклонение,

§ дисперсия (средний квадрат отклонения),

§ среднее квадратическое отклонение,

§ коэффициент вариации.

Размах вариации является наиболее простым измерителем вариации и представляет собой разность между максимальным и минимальным значениями признака в совокупности:

где R – размах вариации;

х max – максимальное значение признака;

х min – минимальное значение признака.

Размах вариации учитывает лишь крайние отклонения и не отражает колеблемости всех вариант в совокупности.

Для получения обобщенной характеристики распределения отклонений исчисляют среднее линейное отклонение , которое учитывает различия всех единиц совокупности. Данный показатель представляет собой среднюю арифметическую величину из отклонений индивидуальных значений признака от средней арифметической без учета знака этих отклонений.

где – среднее линейное отклонение;

х i – индивидуальные значения признака;

– среднее значение признака;

n – объем совокупности.

Данная формула представляет собой простое среднее линейное отклонение . Взвешенное среднее линейное отклонение определяется следующим образом:

где f i – частота повторений.

Среднее линейное отклонение как меру вариации признака в статистическом анализе используют довольно редко, так как в большинстве случаев этот показатель не отражает степень рассеивания признака.

Для преодоления недостатков среднего линейного отклонения вычисляют показатель, наиболее объективно отражающий меру вариации – дисперсию (средний квадрат отклонений). Она определяется как средняя из отклонений, возведенных в квадрат.

- простая дисперсия

- взвешенная дисперсия

При возведении отклонений вариант от средней арифметической величины в квадрат положительные и отрицательные отклонения получают один и тот же положительный знак. Кроме того, большие отклонения от средней величины, будучи возведенными в квадрат, получают и больший «удельный вес», оказывая большее влияние на величину показателя вариации. Однако, возводя отклонения вариант от средней арифметической величины в квадрат, мы искусственно увеличиваем и сам показатель вариации. Чтобы преодолеть этот недостаток, вычисляется среднее квадратическое отклонение , которое исчисляется путем извлечения квадратного корня из среднего квадрата отклонения (дисперсии).

Дисперсия и среднее квадратическое отклонение являются общепринятыми мерами вариации признака.

Приведенные показатели вариации выражаются именованными числами, имею те же единицы измерения, что и изучаемый признак, т.е. дают представление об абсолютной величине вариации признака.

Для сравнения степени колеблемости разнородных явлений, разных по своему характеру и размерам признаков, используется относительный показатель вариации, который называется коэффициентом вариации.

Коэффициент вариации дает возможность сопоставить вариацию одного и того же признака в разных статистических совокупностях, а также разнородных признаков одной и той же или различных статистических совокупностей.

где V – коэффициент вариации;

– среднее квадратическое отклонение;

– среднее арифметическое значение признака

По величине коэффициента вариации судят об однородности совокупности. Если его значение не превышает 33%, то совокупность считается однородной.

Рассмотрим порядок расчета показателей вариации на следующем примере.

Пример 4.7.

Имеются данные промежуточной аттестации студентов одной из групп юридического факультета.

5 5 4 4 5 5 5 2 4 4 3 5 4 4 3 5 5 5 3 2 4 3 4 5 4 5 3 5 2 2 4 5 3 3 5

Найти размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Сделать выводы.

Решение.

Составим таблицу для промежуточных вычислений – таблица 47.

Таблица 4.7

Баллы, x i Частота, f i x i f i x i - |x i - | f i (x i - ) 2 (x i - ) 2 f i
-2
-1
Итого:

1) Найдем средний балл по формуле взвешенной средней арифметической:

балла

2) Размах вариации равен балла

3) Среднее линейное отклонение ищем по формуле взвешенного линейного отклонения балла

4) Дисперсия также находится в данном случае по формуле взвешенной дисперсии

5) Среднее квадратическое отклонение

6) Коэффициент вариации

Вывод: коэффициент вариации меньше 33%, следовательно, данная совокупность однородная.

В данном случае рассматривался пример вычисления показателей вариации для дискретного ряда. Для интервального ряда порядок вычисления показателей вариации аналогичен, а x i будет соответствовать серединам интервалов.

Контрольные вопросы

1. Понятие средней величины в статистике.

2. Виды средних величин. Их краткая характеристика.

3. Средняя арифметическая. Ее виды.

4. Свойства средней арифметической.

5. Структурные средние.

6. Понятие моды и медианы.

7. Определение моды и медианы в дискретном ряду распределения.

8. Определение моды и медианы в интервальном ряду распределения.

9. Графический метод определения структурных средних.

10. Понятие вариации признака.

11. Абсолютные показатели вариации признака в совокупности.

12. Коэффициент вариации, его роль в статистическом анализе.

Задачи

Задача 1 . Годовая нагрузка 20 судей городского суда, специализирующихся на рассмотрении гражданских дел различной направленности, составила: 17;42;47;47;50;50;50;63;68;68;75;78;80;80;85;72;81;45;55;60. Вычислите среднюю годовую нагрузку на одного судью.

Задача 2 . Возрастной состав лиц, совершивших пре­ступления, характеризуется следующими данными: в возрасте 14-15 лет – 69,2 тыс. чел.; 16-17 лет – 138,9; 18-24 года – 363,3; 25-29 лет – 231,0; 30 лет и старше – 791,6 тыс. чел.. Вычислите средний возраст преступников.

Задача 3 . Состояние преступности по населенным пунктам региона характеризуется следующими данными:

Определите моду и медиану количества совершенных преступлений.

Задача 4 . Имеются данные о среднем размере ущерба от преступных посягательств в результате совершения хищений чужого имущества:

Определите моду и медиану среднего размера ущерба.

Задача 5 . Производительность труда следователей двух подразделений ОВД характеризуется следующими данными:

Вычислить показатели вариации производительности труда следователей в 1-ом и 2-ом подразделениях, по результатам расчета сделать выводы.

Задача 6 . По данным о распределении числа правонарушений по возрасту их субъектов определить среднее линейное отклонение, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Сделать выводы.

  1. СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА ВЗАИМОСВЯЗИ СОЦИАЛЬНО-ПРАВОВЫХ ЯВЛЕНИЙ

Одна из основных задач, с которой встречается каждый юрист, правовед – оценка взаимосвязи между переменными, отражающими социально-правовые явления или процессы. К примеру, нередко проблему преступности молодежи рассматривают в зависимости от уровня безработицы. Неэффективность институтов социальной защиты связывают с миграционными потоками, рассматривают как последствия въезда (выезда) на территорию дополнительного числа людей и т.д.

Очевидно, что точность полученных результатов будет зависеть от того, насколько полно мы учтем взаимосвязь всех возможных переменных величин при построении статистической модели изучаемого социально-правового процесса или явления.

Связи в статистике классифицируют по тесноте, направлению, форме и числу факторов.

По тесноте различают функциональные и статистические связи.

При функциональной связи с изменением значений одной переменной вторая изменяется строго определенным образом, т.е. каждому значению факторного (независимого) признака соответствует одно, строго определенное значение результативного (зависимого) признака. В реальности функциональных связей не существует, они являются лишь абстракциями, полезными при анализе явлений.

Связь, при которой каждому значению факторного признака соответствует не одно, а несколько значений результативного признака называется статистической (стохастической).

По направлению связи делят на прямые (положительные) и обратные (отрицательные). При прямой связи направление изменения факторного признака совпадает направлению изменения результативного признака. При обратной связи направления изменения значений факторного и результативного признаков противоположны.

По аналитической форме различают линейные и нелинейные связи. Линейные связи графически отображаются прямой, нелинейные – параболой, гиперболой, показательной функцией и т.п.

В зависимости от количества факторов, действующих на результативный признак, существуют парные (однофакторные) и множественные (многофакторные) связи. В случае парной связи значения результативного признака обусловлены действием одного фактора, при множественной связи – нескольких факторов.

Для исследования статистических связей используется целый комплекс методов: корреляционный анализ, регрессионный анализ, дискриминантный анализ, кластерный анализ, факторный анализ и др. Остановимся на рассмотрении корреляционного и регрессионного анализа.

Корреляционно-регрессионный анализ как общее понятие позволяет решать следующие задачи:

§ измерение тесноты связи между двумя (и более) переменными величинами;

§ определение направления связи;

§ установление аналитического выражения (формы) взаимосвязи между явлениями;

§ определение возможных ошибок показателей тесноты связи и параметров уравнений регрессии.

Статистические методы различных обобщений, указывая на наличие прямой или обратной связи между признаками, не дают представления о мере связей, ее количественном выражении. Эту задачу решает корреляционный анализ, который позволяет установить характер взаимосвязи и количественно ее измерить.

Для измерения тесноты связи между результативным и факторным признаками наиболее широко используется линейный коэффициент корреляции , который был введен К. Пирсоном. В теории разработаны различные модификации формул для расчета коэффициента корреляции.

Где - среднее арифметическое произведения факторного и результативного признака;

Среднее арифметическое факторного признака;

Среднее арифметическое результативного признака;

Среднее квадратическое отклонение факторного признака;

Среднее квадратическое отклонение результативного признака;

n – число наблюдений.

Линейный коэффициент корреляции принимает значения в диапазоне от – 1 до 1. Чем ближе его значение по абсолютной величине к 1, тем теснее связь. Его знак указывает на направление связи: знак «–» соответствует обратной связи, знак «+» – прямой. Степень тесноты взаимосвязи признаков в зависимости от коэффициента корреляции приведена в таблице 5.1.

Таблица 5.1

Для оценки значимости коэффициента корреляции применятся t -критерий Стьюдента . Для этого определяется расчетное (фактическое) значение критерия:

Где - линейный коэффициент парной корреляции;

n – объем совокупности.

Расчетное значение t -критерия сравнивается с критическим (табличным), которое выбирается из таблицы значений Стьюдента (приложение 1) в зависимости от заданного уровня значимости и числа степеней свободы k = n – 2.

Если , то величина коэффициента корреляции признается существенной.

Рассмотрим расчет линейного коэффициента корреляции на примере.

Пример 5.1.

Из имеющихся 11 пар данных на осужденных с информацией: стаж работы/ количество изготовленных изделий, представленных в таблице 5.2, рассчитать линейный коэффициент корреляции, сделать выводы:

Регрессионный анализ позволяет установить аналитическую зависимость, в которой изменение среднего значения результативного признака обусловлено влиянием одной или нескольких независимых величин, а множество прочих факторов, также оказывающих влияние на результативны

Вариация – это изменение (колеблемость) значений признака в пределах изучаемой совокупности при переходе от одного объекта (группы объектов), или от одного случая к другому. Абсолютные и относительные показатели вариации, характеризующие колеблемость значений варьирующего признака, позволяют, в частности, измерить степень связи и взаимозависимости между признаками, определить степень однородности совокупности, типичности и устойчивости средней, определить величину погрешности выборочного наблюдения, статистически оценить закон распределения совокупности и т. п.

В этой теме необходимо уяснить сущность (смысл), назначение и способы вычисления каждого показателя вариации, рассматриваемого в курсе теории статистики: размах вариации, среднее линейное отклонение, средний квадрат отклонений (дисперсию), среднее квадратическое отклонение, относительные коэффициенты вариации (коэффициент осцилляции, коэффициент среднего линейного отклонения, коэффициент вариации).

Размах вариации (R ) представляет собой разность между максимальным (х max) и минимальным (х min) значениями признака в совокупности (в ряду распределения):

R = х max - х min. (5.1)

Мерой других показателей вариации является разность не между крайними значениями признака, а средняя разность между каждым значением признака и средней величиной этих признаков. Разность между отдельным значением признака и средней называют отклонением.

Среднее линейное отклонение вычисляется по следующим формулам:

по индивидуальным (несгруппированным) данным

; (5.2)

по вариационным рядам (сгруппированным данным)

. (5.3)

Так как алгебраическая сумма отклонений индивидуальных значений признака от средней (согласно нулевому свойству) всегда равна нулю, то при расчете среднего линейного отклонения используется арифметическая сумма отклонений, взятая по модулю, т.е.
.

Среднее линейное отклонение имеет ту же размерность, что и признак, для которого оно исчисляется.

Дисперсия и среднее квадратическое отклонение. Среднее линейное отклонение относительно редко применяется для оценки вариации признака. Поэтому обычно вычисляются дисперсия ( 2) и среднее квадратическое отклонение (). Эти показатели применяются не только для оценки вариации признака, но и для измерения связи между ними, для оценки величины ошибки выборочного наблюдения и других целей.

Дисперсия признака рассчитывается по формулам:

по первичным данным

; (5.4)

по вариационным рядам

. (5.5)

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:

по первичным данным

; (5.6)

по вариационным рядам

. (5.7)

Среднее квадратическое отклонение так же, как и среднее линейное отклонение, имеет ту же размерность, что и сам исходный признак.

Дисперсию можно определить и как разность между средним квадратом вариантов и квадратом их средней величины, т. е.
. (5.8)

В этом случае по первичным данным дисперсия равна:

(5.9)

Применительно к сгруппированным данным, расчет дисперсии этим способом в развернутом виде представим в таком виде:

. (5.10)

Для рядов распределения с равными интервалами значение дисперсии можно вычислить, применяя способ условных моментов, т. е.

, (5.11)

где
- первый условный момент; (5.12)

- второй условный момент. (5.13)

Среднее квадратическое отклонение по способу условных моментов определяется по формуле:

(5.14)

Преобразуя выражение расчета дисперсии по способу условных моментов, получим формулу вида:
(5.15)

На основе одних и тех же исходных данных получим одинаковое значение дисперсии.

Относительные показатели вариации вычисляются как отношение ряда абсолютных показателей вариации к их средней арифметической и выражаются в процентах:

коэффициент осцилляции -
; (5.16)

коэффициент относительного линейного отклонения -
; (5.17)

коэффициент вариации -
. (5.18)

Задача 1 . Рассмотрим способы расчета показателей вариации на основе данных табл. 5.1.

Таблица 5.1. Исходные данные для расчета показателей вариации

Затраты времени на производство деталей мин

Количество деталей, шт. (f)

Середина интервала (х)

; к = 2

Приведенный ряд распределения ранжированный, поэтому здесь легко найти минимальное значение признака, оно равно 8 мин. (10 - 2), и максимальное, равное 18 мин. (16 + 2). Значит, размах вариации признака в этом ряду составит 10 мин., т. е.

R = x max – x min = 18 – 8 = 10 мин.

Вычислим среднее линейное отклонение. Прежде всего необходимо вычислить среднюю величину . Все вычисления будем вести в табличной форме (табл. 5.1.), отводя для каждой вычислительной операции графу в таблице.

Поскольку исходные данные представлены рядом распределения, то

мин.

мин.

Покажем способы расчета дисперсии:

а) обычным способом (по определению):

;

б) как разность между средним квадратом и квадратом средней величины:

Для определения величины дисперсии по этой формуле необходимо вычислить средний квадрат вариантов признака по формуле:

;

 2 =178,6 – (13,2) 2 =4,36;

в) по способу условных моментов:

;

;

г) на основе преобразования формулы расчета дисперсии по способу условных моментов имеем:

Дисперсия – число отвлеченное, не имеющее единиц измерения.

Среднее квадратическое отклонение вычислим путем извлечения корня квадратного из дисперсии:

мин.

По способу условных моментов величину среднего квадратического отклонения определим так:

Вычислим относительные показатели вариации:

%;

%;

%.

Основным относительным показателем вариации является коэффициент вариации (V). Он используется для сравнительной оценки меры колеблемости признаков, выраженных в различных единицах измерения.

Наряду с вариацией количественных признаков может наблюдаться и вариация качественных признаков (в частности альтернативной изменчивости качественных признаков). В этом случае каждая единица изучаемой совокупности либо обладает каким-то свойством, либо нет (например, каждый взрослый человек либо работает, либо нет). Наличие признака у единиц совокупности обозначают 1, а отсутствие –0; долю же единиц совокупности, обладающих изучаемым признаком, обозначают p, а не обладающих им – q. Дисперсия альтернативного признака определяется по формуле:

; (5.19)

p + q = 1 (5.20)

Если, например, доля поступивших в университет равна 30%, а не поступивших – 70%, то дисперсия равна 0,21(0,3 · 0,7). максимальное значение произведения pq равно 0,25 (при условии, когда одна половина единиц обладает данным признаком, а другая половина нет: (0,5 · 0,5 = 0,25).

Способ разложения общей дисперсии. Для оценки влияния различных факторов, определяющих колеблемость индивидуальных значений признака, воспользуемся разложением общей дисперсии на составляющие: на так называемую групповую дисперсию и среднюю из внутригрупповых дисперсий:

, (5.21)

где
– общая дисперсия, характеризующая вариацию признака как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности.

Вариацию признака, обусловленную влиянием фактора, положенного в основу группировки, характеризует межгрупповая дисперсия  2 , которая является мерой колеблемости частных средних по группам
вокруг общей средней и исчисляется по формуле:

, (5.22)

где n j – число единиц совокупности в каждой группе;

j – порядковый номер группы.

Вариацию признака, обусловленную влиянием всех прочих факторов, кроме группировочного (факторного), характеризует в каждой группе внутригрупповая дисперсия:

, (5.23)

где i – порядковый номер x и f в пределах каждой группы.

По совокупности в целом средняя из внутригрупповых дисперсий определяется по формуле:

(5.24)

Отношение межгрупповой дисперсии  2 к общей
даст коэффициент детерминации:

(5.25)

который характеризует долю вариации результативного признака, обусловленную вариацией факторного признака, положенного в основание группировки.

Показатель, полученный как корень квадратный из коэффициента детерминации, называется коэффициентом эмпирического корреляционного отношения, т.е.:

(5.26)

Он характеризует тесноту связи между результативным и факторным (положенным в основу группировки) признаками. Численное значение коэффициента эмпирического корреляционного отношения имеет два знака: . При решении вопроса о том, с каким знаком его следует брать, необходимо иметь ввиду: если вариация факторного и результативного признаков идет синхронно в одном и том же направлении (возрастает или убывает), то корреляционные отношение берется со знаком плюс; если же изменение этих признаков идет в противоположных направлениях, то оно берется со знаком минус.

Для вычисления групповых и межгрупповых дисперсий можно применять любой из описанных выше способов исчисления среднего квадрата отклонений.

Задача 2. Вычислим все названные дисперсии по исходным данным табл. 5.2.

Таблица 5.2. Распределение посевной площади озимой пшеницы по урожайности

Номер участка

Урожайность, ц/га

Посевная площадь, га

Вычислим среднюю урожайность озимой пшеницы по всем участкам (общая средняя):

ц/га.

Общую дисперсию найдем по формуле:

В гр. 6 табл. 5.2. вычислим значения для расчета среднего квадрата вариантов признака:

.

Находим общую дисперсию:

Урожайность зависит от многих факторов (качество почвы, размер внесения органических и минеральных удобрений, качество семян, сроки сева, уход за посевами и др.) Общая дисперсия в данном случае измеряет колеблемость урожайности за счет всех факторов.

Задача 3. Разобьем совокупность участков на две группы: I группа – посевные площади, на которых не вносились органические удобрения; II – площади, на которых они вносились. К первой группе отнесем участки 1-4, а ко второй – 4-8. По данным этих групп рассчитаем остальные из необходимых нам дисперсий, используя уже произведенные в табл. 5.2. вычисления.

Таблица 5.3. Расчетные данные для вычисления межгрупповой и групповых дисперсий

Номер участка

Урожайность, ц/га (х)

Посевная площадь, га (f)

Номер участка

Урожайность, ц/га (х)

Посевная площадь, га (f)

Определяем:

для I группы:

для II группы:

а) групповую среднюю

а) групповую среднюю

ц/га;

ц/га;

б) средний квадрат вариантов признака

;

;

в) групповую дисперсию

в) групповую дисперсию

Определяем среднюю из групповых дисперсий:

.

Находим межгрупповую дисперсию:

Средняя из групповых дисперсий измеряет колеблемость признака за счет всех прочих факторов, кроме положенного в основание группировки (разграничения на группы), а межгрупповая – за счет именно этого фактора. Сумма этих дисперсий должна дать общую дисперсию, а именно:

Отношение межгрупповой дисперсии к общей в нашем примере даст следующее значение коэффициента детерминации:

, или 71,8%,

т. е. вариация урожайности озимой пшеницы на 71,8% зависит от вариации размеров внесения органических удобрений. Остальные же 28,2% вариации урожайности зависит от влияния всех остальных факторов, кроме размеров внесения органических удобрений.

Коэффициент эмпирического корреляционного отношения составит:

.

Это говорит о том, что внесение органических удобрений оказывает весьма существенное влияние на урожайность.

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину.

Известно, что единицы каждого массового явления обладают многочисленными признаками. Какой бы из этих признаков мы ни взяли, его значения у отдельных единиц будут различными, они изменяются, или, как говорят в статистике , варьируют от одной единицы к другой. Так, например, заработная плата работника определяется его квалификацией, характером труда, стажем работы и целым рядом других факторов, поэтому изменяется в весьма широких пределах. Совокупное влияние всех факторов определяет размер заработка каждого работника, тем не менее можно говорить о среднемесячной заработной плате работников разных отраслей экономики . Здесь мы оперируем типичным, характерным значением варьирующего признака, отнесенным к единице многочисленной совокупности.

Средняя величина отражает то общее, что характерно для всех единиц изучаемой совокупности. В то же время она уравновешивает влияние всех факторов, действующих на величину признака отдельных единиц совокупности, как бы взаимно погашая их. Уровень (или размер) любого общественного явления обусловлен действием двух групп факторов. Одни из них являются общими и главными, постоянно действующими, тесно связанными с природой изучаемого явления или процесса, и формируют то типичное для всех единиц изучаемой совокупности, которое и отражается в средней величине. Другие являются индивидуальными, их действие выражено слабее и носит эпизодический, случайный характер. Они действуют в обратном направлении, обусловливают различия между количественными признаками отдельных единиц совокупности, стремясь изменить постоянную величину изучаемых признаков. Действие индивидуальных признаков погашается в средней величине. В совокупном влиянии типичных и индивидуальных факторов, которое уравновешивается и взаимно погашается в обобщающих характеристиках, проявляется в общем виде известный из математической статистики фундаментальный закон больших чисел.

В совокупности индивидуальные значения признаков сливаются в общую массу и как бы растворяются. Отсюда и средняя величина выступает как «обезличенная», которая может отклоняться от индивидуальных значений признаков, не совпадая количественно ни с одним из них. Средняя величина отражает общее, характерное и типичное для всей совокупности благодаря взаимопогашению в ней случайных, нетипичных различий между признаками отдельных ее единиц, так как ее величина определяется как бы общей равнодействующей из всех причин.

Однако для того, чтобы средняя величина отражала наиболее типичное значение признака, она должна определяться не для любых совокупностей, а только для совокупностей, состоящих из качественно однородных единиц. Это требование является основным условием научно обоснованного применения средних величин и предполагает тесную связь метода средних величин и метода группировок в анализе социально-экономических явлений. Следовательно, средняя величина - это обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу однородной совокупности в конкретных условиях места и времени.

Определяя, таким образом, сущность средних величин, необходимо подчеркнуть, что правильное исчисление любой средней величины предполагает выполнение следующих требований:

  • качественная однородность совокупности, по которой вычислена средняя величина. Это означает, что исчисление средних величин должно основываться на методе группировок, обеспечивающем выделение однородных, однотипных явлений;
  • исключение влияния на вычисление средней величины случайных, сугубо индивидуальных причин и факторов. Это достигается в том случае, когда вычисление средней основывается на достаточно массовом материале, в котором проявляется действие закона больших чисел, и все случайности взаимно погашаются;
  • при вычислении средней величины важно установить цель ее расчета и так называемый определяющий показа-телъ (свойство), на который она должна быть ориентирована.

Определяющий показатель может выступать в виде суммы значений осредняемого признака, суммы его обратных значений, произведения его значений и т. п. Связь между определяющим показателем и средней величиной выражается в следующем: если все значения осредняемого признака заменить средним значением, то их сумма или произведение в этом случае не изменит определяющего показателя. На основе этой связи определяющего показателя со средней величиной строят исходное количественное отношение для непосредственного расчета средней величины. Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.

Средняя величина, рассчитанная в целом по совокупности, называется общей средней; средние величины, рассчитанные для каждой группы, - групповыми средними. Общая средняя отражает общие черты изучаемого явления, групповая средняя дает характеристику явления, складывающуюся в конкретных условиях данной группы.

Способы расчета могут быть разные, поэтому в статистике различают несколько видов средней величины, основными из которых являются средняя арифметическая, средняя гармоническая и средняя геометрическая.

В экономическом анализе использование средних величин является основным инструментом для оценки результатов научно-технического прогресса, социальных мероприятий, поиска резервов развития экономики. В то же время следует помнить о том, что чрезмерное увлечение средними показателями может привести к необъективным выводам при проведении экономико-статистического анализа. Это связано с тем, что средние величины, будучи обобщающими показателями, погашают, игнорируют те различия в количественных признаках отдельных единиц совокупности, которые реально существуют и могут представлять самостоятельный интерес.

Виды средних величин

В статистике используют различные виды средних величин, которые делятся на два больших класса:

  • степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);
  • структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины - средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй - 7, третий - 4, четвертый - 10, пятый- 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для определения средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек , возраст которых варьируется от 18 до 22 лет, где xi - варианты осредняемого признака, fi - частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Таблица 5.1

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:

Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины - средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/ xi). Если отрезки пути обозначить через fi, то весь путь выразиться как Σfi, а время, затраченное на весь путь, - как Σ fi/ xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi - отдельные варианты; n - число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Таблица 5.2

Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая - при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где - средняя величина; - индивидуальное значение; n - число единиц изучаемой совокупности; k - показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние - мода (Мо) и медиана (Ме).

Мода - величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; fm_ 1 - частота предшествующего интервала; fm+ 1 - частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; f - число членов ряда;

∫m-1 - сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили - на 10 равных частей. Квартилей насчитывается три, а децилей - девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Показатели вариации

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения - атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум - это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k - число вариантов значений признака. Частоты удобно заменять частостями - wi. Частость - относительный показатель частоты - может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax - Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели

вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:

Абсолютное значение (модуль) отклонения варианта от средней арифметической; f- частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая - в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации - дисперсию.

Дисперсия (σ 2) - средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (σ) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков - среднее линейное и среднее квадртическое отклонение - не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:

Наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

В статистике средней величиной называют обобщающий показатель совокупности однородных общественных или природных явлений, который показывает типичный уровень варьирующего признака в расчете на единицу совокупности в конкретный момент времени.

Нахождение среднего - один из распространенных приемов обобщения. Средняя величина отражает то общее, что типично (характерно) для всех единиц изучаемой совокупности, но в то же время она игнорирует различия отдельных единиц. Мы уже говорили, что при неограниченном увеличении количества наблюдений (п -» оо) средняя величина, согласно закону больших чисел, будет неограниченно приближаться к его математическому ожиданию, т. е. при п -> оо можно записать х ~ М[Х], здесь х - средняя величина. То есть средняя величина - это оценка математического ожидания.

Сделаем небольшое отступление и приведем краткие сведения об оценках параметров, полученных в результате п опытов. Предположим, что надо определить по результатам п опытов некоторый параметр d. Приближенное значение этого параметра будем называть его оценкой и обозначим d. Оценка d должна удовлетворять ряду требований, чтобы в каком-то смысле быть оценкой “доброкачественной”.

Оценка d при увеличении числа опытов должна сходиться по вероятности к искомому параметру, т. е.

Оценка, обладающая таким свойством, называется состоятельной.

Кроме того, пользуясь оценкой d вместо самого параметра d, желательно не делать систематической ошибки, т. е. математическое ожидание оценки должно быть равным самому параметру:

Оценка, которая обладает данным свойством, называется несмещенной.

Было бы хорошо, если бы выбранная несмещенная оценка d была как можно менее случайной, т. е. обладала по сравнению с другими минимальной дисперсией:

Оценка, которая обладает данным свойством, называется эффективной.

В реальных условиях не всегда удается удовлетворить всем перечисленным требованиям. Тем не менее при выборе оценки любого параметра желательно эту оценку рассмотреть со всех перечисленных точек зрения.

Вернемся к средним величинам. При их вычислении при большом количестве наблюдений случайности взаимопога- шаются (это следует из закона больших чисел), следовательно, можно абстрагироваться от несущественных особенностей изучаемого явления и от количественных значений признака в каждом конкретном опыте.

Крупный вклад в обоснование и развитие теории средних величин внес А. Кетле. Согласно его учению массовые процессы формируются под влиянием двух групп причин. К первой группе общих для всех единиц массовой совокупности причин относятся те из них, которые определяют состояние массового процесса. Они формируют типичный уровень для единиц данной однородной совокупности.

Вторая группа причин формирует специфические особенности отдельных единиц массовой совокупности и, следовательно, их разброс от типичного уровня.

Эти причины не связаны с природой изучаемого явления, поэтому их называют случайными причинами.

Средняя величина, полученная по всей совокупности, называется общей, а средние величины, вычисленные по каждой группе, называются групповыми средними. Есть два вида средних величин: степенные средние (средняя арифметическая и др.), структурные средние (мода, медиана).

Рассмотрим степенные средние. Степенные средние определяются исходя из формулы

где х - среднее значение;

х { - текущее значение изучаемого признака;

т - показатель степени средней;

п - количество признаков (вариант).

В зависимости от показателя т степени средней получаем следующие виды степенных средних:

  • - среднюю гармоническую х гар, если т = -1;
  • - среднюю геометрическую эс геом, если т = 0;
  • - среднюю арифметическую х ар, если т = 1;
  • - среднюю квадратическую х квад, если т = 2;
  • - среднюю кубическую х куб., если т = 3,
  • - ИТ. д.

При использовании одних и тех же данных чем больше т в формуле (6.4), тем больше значение средней, т. е.

Приведем конкретные формулы для вычисления некоторых видов степенных средних.

При т = -1 получаем среднюю гармоническую:

В том случае, если исходные данные сгруппированы, используются взвешенные средние. В качестве веса может использоваться частота р (количество опытов, в которых появилось интересующее нас событие) или относительная частота

Запишем формулы для взвешенной средней гармонической:

При т = 0 получаем среднюю геометрическую:

т. е. получили неопределенность.

Для ее раскрытия прологарифмируем обе части формулы (6.4.)

затем подставляем т = 0 и получаем

т. е. имеем неопределенность вида Для раскрытия этой неопределенности применяем правило Лопиталя. Полученный результат потенцируется, и окончательно получаем

Широкое применение средняя геометрическая получила для нахождения средних темпов изменения в рядах динамики и в рядах распределения.

Запишем формулы для взвешенной средней геометрической.

Приведем конкретный пример нахождения средней геометрической взвешенной по формуле (6.11).

Пример 6.1

Исходные данные наблюдений приведены в табл. 6.1.

Таблица 6.1

В табл. 6.1 х. - результаты, принятые некоторой случайной величиной X в г-м опыте; р. - частота события - показывает, сколько раз в результате всех опытов появилось интересующее нас событие. Например, х = 2 появилось в 24 опытах 5 раз.

Относительная частота события (частость).

По формуле (6.11) получаем:

По формуле (6.12) имеем

При т = 1 получаем среднюю арифметическую:

Средняя арифметическая - наиболее распределенный вид среди всех видов степенных средних. Она используется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значений признаков отдельных единиц.

Приведем формулы для нахождения средней арифметической взвешенной:

При большом количестве наблюдений, согласно закону больших чисел, формула (6.15) определяет оценку математического ожидания т. е.

При т = 2 получаем среднюю квадратическую:

Она используется для вычисления среднего размера признака, выраженного в квадратных единицах.

Формулы для нахождения средней квадратической взвешенной имеют вид:

При га = 3 получаем среднюю кубическую:

Она применяется для нахождения среднего размера признака, выраженного в кубических единицах.

Формулы для вычисления средней кубической взвешенной имеют вид:

Теперь рассмотрим структурные средние: моду и медиану. В статистике, в отличие от теории вероятностей, имеем дело с оценками этих величин. Мы будем обозначать их теми же буквами, что и в главе 2, но с тильдой.

Мода в статистике (Мо) - значение случайной величины, которое встречается в статистическом ряду распределения чаще всего, т. е. имеет наибольшую частоту или относительную частоту (частость).

Например, в табл. 6.1 наибольшая относительная частота / = 0,33, поэтому мода равна Мо = 5.

Если мы имеем группированный ряд распределения с равными интервалами, то моду можно найти по формуле

где Мо нижн - нижняя граница модального интервала;

г Мо - длина модального интервала;

Рмо - частота модального интервала;

М-мо_, - частота интервала, предшествующего модальному;

М-мо +1 -- частота интервала, следующего за модальным.

Заметим, что для расчета можно использовать и относительные частоты.

Медиана в статистике - варианта, которая находится в середине ранжированного ряда распределения, т. е. значение медианы находиться по ее порядковому номеру.

Если ряд распределения имеет нечетное число элементов, номер медианы находиться по формуле

Например, в табл. 6.2 приведены величины окладов профессорско-преподавательского состава кафедры высшей математики.

Таблица 6.2

Количество элементов ряда равно 5, поэтому по формуле (6.23) находим номер медианы , следовательно, меди

ана в данном случае равна

Если ряд содержит четное число элементов, то варианта находится как средняя из двух вариант, находящихся в середине ряда.

В группированном ряду распределения медиана (так как она делит всю совокупность на две равные части) находится в каком-то из интервалов.

Кумулятивная (накопленная) частота (или относительная частота) равна или превышает полусумму всех частот ряда (для относительных частот она равна 1/2 или превышает 1/2).

В этом случае значение медианы вычисляется по формуле

где - нижняя граница медианного интервала;

Длина медианного интервала;

Полусумма частот;

Сумма частот, накопленная до начала медианного интервала;

Частота медианного интервала.