Для характеристики рядов распределения (структуры вариационных рядов), наряду со средней, используются т. н. структурные средние : мода и медиана . Мода и медиана наиболее часто используются в экономической практике.

Мода - варианта, которая наиболее часто встречается в ряду распределения (в данной совокупности).

В дискретных вариационных рядах мода определяется по наибольшей частоте. Предположим товар А реализуют в городе 9 фирм по следующим ценам в рублях:

44; 43; 44; 45; 43; 46; 42; 46;43. Так как чаще всего встречается цена 43 рубля, то она и будет модальной.

При характеристике социальных групп населения по уровню дохода следует использовать модальное значение, нежели среднее. Средняя будет занижать одни показатели и завышать другие - тем самым осредняя (уравнивания) доходы всех слоев населения.

В интервальных вариационных рядах моду определяют приближенно по формуле:

    ХМ0 - нижняя граница модального интервала;

    h Mo - величина (шаг, ширина) модального интервала;

    f 1 - локальная частота интервала, предшествующего модальному;

    f 2 - локальная частота модального интервала;

    f 3 - локальная частота интервала, следующего за модальным.

Распределение населения по уровню среднедушевого месячного дохода

Интервал 1000-3000 в данном распределении будет модальным, т.к. он имеет наибольшую частоту (f=35,5). Тогда по вышеуказанной формуле мода будет равна:

На графике (гистограмме распределения) моду определяют следующим образом: по оси ординат откладывают локальные частоты, а по оси абсцисс -интервалы либо центры интервалов. Выбирают самый высокий столбик, которому соответствует величина признака с наибольшей частотой в ряду распределения.

Мода применяется для решения некоторых практических задач. Так, например, при изучении товарооборота рынка берется модальная цена, для изучения спроса на обувь, одежду используют модальные размеры обуви и одежды.

Медиана - это численное значение признака у той единицы совокупности, которая находится в середине ранжированного ряда (построенного в порядке возрастания, либо убывания значений изучаемого признака). Медиану иногда называют серединной вариантой , т.к. она делит совокупность на две равные части таким образом, чтобы по обе ее стороны находилось одинаковое число единиц совокупности. Если всем единицам ряда присвоить порядковые номера, то порядковый номер медианы будет определяться по формуле (n+1):2 для рядов, где n - нечетное . Если же ряд с четным числом единиц, томедианой будет являться среднее значение между двумя соседними вариантами, определенными по формуле: n:2, (n+1):2, (n:2)+1.

В дискретных вариационных рядах с нечетным числом единиц совокупности - это конкретное численное значение в середине ряда.

Нахождение медианы в интервальных вариационных рядах требует предварительного определения интервала, в котором находится медиана, т.е. медианного интервала – этот интервал характеризуется тем, что его кумулятивная (накопленная) частота равна полусумме или превышает полусумму всех частот ряда.

    X Me -нижняя граница медианного интервала

    h Me -величина медианного интервала;

    S Me-1 -сумма накопленных частот интервала, предшествующего медианному интервалу;

    f Me -локальная частота медианного интервала.

По данным таблицы определим медианное значение среднедушевого дохода. Для этого необходимо определить какой интервал будет медианным. Используем формулу номера медианной единицы ряда, т.е. середины:

Дробное значение N (всегда при четном числе членов) равное 50,5% говорит о том, что середина ряда находится между 50% и 51%, т.е. в третьем интервале. Иными словами: медианным считается интервал, на который впервые приходится более половины суммы накопленных частот. Отсюда медиана:

Для того, чтобы определить графически интервал, в котором находится медиана, по оси ординат откладывают накопленные частоты, а по оси абсцисс - центры интервалов. Из точки на оси ординат, которой соответствует 50.5% суммы накопленных частот, проводят линию параллельно оси абсцисс до пересечения с кумулятой. Из точки пересечения опускают перпендикуляр на ось абсцисс.

Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию. Если M 0

Из соотношения этих показателей следует сделать вывод о правосторонней асимметрии распределения населения по уровню среднедушевого денежного дохода:

Квартиль –это четвертая часть совокупности, определяется как и медиана, только сумму частот необходимо разделить на 4, а при определении квартильного интервала, кумулятивная частота должна быть больше или равна четверти суммы частот совокупности.

Дециль – делит совокупность на десять равных частей. Определяется аналогично как и квартиль, только сумму частот необходимо разделить на 10.

Наряду со средними величинами в качестве статистических характеристик вариационных рядов распределения рассчитываются структурные средние – мода и медиана .
Мода (Mo) представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой, т.е. мода – значение признака, встречающееся чаще всего.
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности, т.е. медиана – центральное значение вариационного ряда.
Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины ∑|x i - Me|=min.

Определение моды и медианы по несгруппированным данным

Рассмотрим определение моды и медианы по несгруппированным данным . Предположим, рабочие бригады, состоящей из 9 человек, имеют следующие тарифные разряды: 4 3 4 5 3 3 6 2 6 . Так как в данной бригаде больше всего рабочих 3-го разряда, этот тарифный разряд будет модальным. Mo = 3.
Для определения медианы необходимо провести ранжирование: 2 3 3 3 4 4 5 6 6 . Центральным в этом ряду является рабочий 4-го разряда, следовательно, данный разряд и будет медианным. Если ранжированный ряд включает четное число единиц, то медиана определяется как средняя из двух центральных значений.
Если мода отражает наиболее распространенный вариант значения признака, то медиана практически выполняет функции средней для неоднородной, не подчиняющейся нормальному закону распределения совокупности. Проиллюстрируем ее познавательное значение следующим примером.
Допустим, нам необходимо дать характеристику среднего дохода группы людей, насчитывающей 100 человек, из которых 99 имеют доходы в интервале от 100 до 200 долларов в месяц, а месячные доходы последнего составляют 50000 долларов (табл. 1).
Таблица 1 - Месячные доходы исследуемой группы людей. Если воспользоваться средней арифметической, то получим средний доход, равный примерно 600 – 700 долларов, который имеет мало общего с доходами основной части группы. Медиана же, равная в данном случае Me = 163 доллара, позволит дать объективную характеристику уровня доходов 99 % данной группы людей.
Рассмотрим определение моды и медианы по сгруппированным данным (рядам распределения).
Предположим, распределение рабочих всего предприятия в целом по тарифному разряду имеет следующий вид (табл. 2).
Таблица 2 - Распределение рабочих предприятия по тарифному разряду

Расчет моды и медианы для дискретного ряда

Расчет моды и медианы для интервального ряд

Расчет моды и медианы для вариационного ряда

Определение моды по дискретному вариационному ряду

Используется построенный ранее ряд значений признака, отсортированных по величине. Если объем выборки нечетный, берем центральное значение; если объем выборки четный, берем среднее арифметическое двух центральных значений.
Определение моды по дискретному вариационному ряду : наибольшую частоту (60 человек) имеет 5-й тарифный разряд, следовательно, он и является модальным. Mo = 5.
Для определения медианного значения признака по следующей формуле находят номер медианной единицы ряда (N Me): , где n - объем совокупности.
В нашем случае: .
Полученное дробное значение, всегда имеющее место при четном числе единиц совокупности, указывает, что точная середина находится между 95 и 96 рабочими. Необходимо определить, к какой группе относятся рабочие с этими порядковыми номерами. Это можно сделать, рассчитав накопленные частоты. Рабочих с этими номерами нет в первой группе, где всего лишь 12 человек, нет их и во второй группе (12+48=60). 95-й и 96-й рабочие находятся в третьей группе (12+48+56=116), следовательно, медианным является 4-й тарифный разряд.

Расчет моды и медианы в интервальном ряду

В отличие от дискретных вариационных рядов определение моды и медианы по интервальным рядам требует проведения определенных расчетов на основе следующих формул:
, (5.6)
где x 0 – нижняя граница модального интервала (модальным называется интервал, имеющий наибольшую частоту);
i – величина модального интервала;
f Mo – частота модального интервала;
f Mo -1 – частота интервала, предшествующего модальному;
f Mo +1 – частота интервала, следующего за модальным.
(5.7)
где x 0 – нижняя граница медианного интервала (медианным называется первый интервал, накопленная частота которого превышает половину общей суммы частот);
i – величина медианного интервала;
S Me -1 – накопленная интервала, предшествующего медианному;
f Me – частота медианного интервала.
Проиллюстрируем применение этих формул, используя данные табл. 3.
Интервал с границами 60 – 80 в данном распределении будет модальным, т.к. он имеет наибольшую частоту. Использую формулу (5.6), определим моду:

Для установления медианного интервала необходимо определять накопленную частоту каждого последующего интервала до тех пор, пока она не превысит половины суммы накопленных частот (в нашем случае 50 %) (табл. 5.11).
Установили, что медианным является интервал с границами 100 – 120 тыс. руб. Определим теперь медиану:

Таблица 3 - Распределение населения РФ по уровню среднедушевых номинальных денежных доходов в марте 1994г.
Группы по уровню среднедушевого месячного дохода, тыс. руб. Удельный вес населения, %
До 20 1,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Свыше 300 7,7
Итого 100,0

Таблица 4 - Определение медианного интервала
Таким образом, в качестве обобщенной характеристики значений определенного признака у единиц ранжированной совокупности могут быть использованы средняя арифметическая, мода и медиана.
Основной характеристикой центра распределения является средняя арифметическая, для которой характерно то, что все отклонения от нее (положительные и отрицательные) в сумме равняются нулю. Для медианы характерно, что сумма отклонений от нее по модулю является минимальной, а мода представляет собой значение признака, которое наиболее часто встречается.
Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию. В симметричных распределениях все три характеристики совпадают. Чем больше расхождение между модой и средней арифметической, тем более асимметричен ряд. Для умеренно асимметричных рядов разность между модой и средней арифметической примерно в три раза превышает разность между медианой и средней, т.е.:
|Mo –`x| = 3 |Me –`x|.

Определение моды и медианы графическим методом

Моду и медиану в интервальном ряду можно определить графически . Мода определяется по гистограмме распределения. Для этого выбирается самый высокий прямоугольник, который является в данном случае модальным. Затем правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Из точки их пересечения опускаем перпендикуляр на ось абсцисс. Абсцисса точки пересечения этих прямых и будет модой распределения (рис. 5.3).


Рис. 5.3. Графическое определение моды по гистограмме.


Рис. 5.4. Графическое определение медианы по кумуляте
Для определения медианы из точки на шкале накопленных частот (частостей), соответствующей 50 %, проводится прямая, параллельная оси абсцисс до пересечения с кумулятой. Затем из точки пересечения опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является медианой.

Квартили, децили, перцентили

Аналогично с нахождением медианы в вариационных рядах распределения можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Так, например, можно найти значение признака у единиц, делящих ряд на четыре равные части, на 10 или на 100 частей. Эти величины называются «квартили», «децили», «перцентили».
Квартили представляют собой значение признака, делящее ранжированную совокупность на 4 равновеликие части.
Различают квартиль нижний (Q 1), отделяющий ¼ часть совокупности с наименьшими значениями признака, и квартиль верхний (Q 3), осекающий ¼ часть с наибольшими значениями признака. Это означает, что 25 % единиц совокупности будут меньше по величине Q 1 ; 25 % единиц будут заключены между Q 1 и Q 2 ; 25 % - между Q 2 и Q 3 , а остальные 25 % превосходят Q 3 . Средним квартилем Q 2 является медиана.
Для расчета квартилей по интервальному вариационному ряду используются формулы:
, ,
где x Q 1 – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25 %);
x Q 3 – нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75 %);
i – величина интервала;
S Q 1-1 – накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;
S Q 3-1 – накопленная частота интервала, предшествующего интервалу, содержащему верхний квартиль;
f Q 1 – частота интервала, содержащего нижний квартиль;
f Q 3 – частота интервала, содержащего верхний квартиль.
Рассмотрим расчет нижнего и верхнего квартилей по данным табл. 5.10. Нижний квартиль находится в интервале 60 – 80, накопленная частота которого равна 33,5 %. Верхний квартиль лежит в интервале 160 – 180 с накопленной частотой 75,8 %. С учетом этого получим:
,
.
Кроме квартилей в вариационных радах распределения могут определяться децили – варианты, делящие ранжированный вариационный ряд на десять равных частей. Первый дециль (d 1) делит совокупность в соотношении 1/10 к 9/10, второй дециль (d 1) – в соотношении 2/10 к 8/10 и т.д.
Вычисляются они по формулам:
, .
Значения признака, делящие ряд на сто частей, называются перцентилями. Соотношения медианы, квартилей, децилей и перцентилей представлены на рис. 5.5.

Зарплат в различных отраслях экономики, температуру и уровень осадков на одной и той же территории за сопоставимые периоды времени, урожайность выращиваемых культур в разных географических регионах и т. д. Впрочем, средняя является отнюдь не единственным обобщающим показателем - в ряде случае для более точной оценки подходит такая величина как медиана. В статистике она широко применяется в качестве вспомогательной описательной характеристики распределения какого-либо признака в отдельно взятой совокупности. Давайте разберемся, чем она отличается от средней, а также чем вызвана необходимость ее использования.

Медиана в статистике: определение и свойства

Представьте себе следующую ситуацию: на фирме вместе с директором работают 10 человек. Простые работники получают по 1000 грн., а их руководитель, который, к тому же, является собственником, - 10000 грн. Если вычислить среднее арифметическое, то получится, что в среднем зарплата на данном предприятии равна 1900 грн. Будет ли справедливым данное утверждение? Или возьмем такой пример, в одной и той же больничной палате находится девять человек с температурой 36,6 °С, и один человек, у которого она равна 41 °С. Арифметическое среднее в этом случае равно: (36,6*9+41)/10 = 37,04 °С. Но это вовсе не означает, что каждый из присутствующих болен. Все это наталкивает на мысль, что одной средней часто бывает недостаточно, и именно поэтому в дополнение к ней используется медиана. В статистике этим показателем называют вариант, который расположен ровно посередине упорядоченного вариационного ряда. Если посчитать ее для наших примеров, то получится соответственно 1000 грн. и 36,6 °С. Другими словами, медианой в статистике называется значение, которое делит ряд пополам таким образом, что по обе стороны от нее (вниз или вверх) расположено одинаковое число единиц данной совокупности. Из-за этого свойства данный показатель имеет еще несколько названий: 50-й перцентиль или квантиль 0,5.

Как найти медиану в статистике

Способ расчета данной величины во многом зависит от того, какой тип вариационного ряда мы имеем: дискретный или интервальный. В первом случае, медиана в статистике находится довольно просто. Все, что нужно сделать, это найти сумму частот, разделить ее на 2 и затем прибавить к результату ½. Лучше всего будет пояснить принцип расчета на следующем примере. Предположим, у нас есть сгруппированные данные по рождаемости, и требуется выяснить, чему равна медиана.

Номер группы семей по кол-ву детей

Кол-во семей

Проведя нехитрые подсчеты, получим, что искомый показатель равен: 195/2 + ½ = варианта. Для того чтобы выяснить, что это означает, следует последовательно накапливать частоты, начиная с наименьшей варианты. Итак, сумма первых двух строк дает нам 30. Ясно, что здесь 98 варианты нет. Но если прибавить к результату частоту третьей варианты (70), то получится сумма, равная 100. В ней как раз и находится 98-я варианта, а значит медианой будет семья, у которой есть двое детей.

Что же касается интервального ряда, то здесь обычно используют следующую формулу:

М е = Х Ме + i Ме * (∑f/2 - S Me-1)/f Ме, в которой:

  • Х Ме - первое значение медианного интервала;
  • ∑f - численность ряда (сумма его частот);
  • i Ме - величина медианного диапазона;
  • f Ме - частота медианного диапазона;
  • S Ме-1 - сумма кумулятивных частот в диапазонах, предшествующих медианному.

Опять же, без примера здесь разобраться довольно сложно. Предположим, есть данные по величине

Зарплата, тыс. руб.

Накопленные частоты

Чтобы воспользоваться вышеприведенной формулой, вначале нам нужно определить медианный интервал. В качестве такого диапазона выбирают тот, накопленная частота которого превышает половину всей суммы частот или равна ей. Итак, разделив 510 на 2, получаем, что этому критерию соответствует интервал со значением зарплаты от 250000 руб. до 300000 руб. Теперь можно подставлять все данные в формулу:

М е = Х Ме + i Ме * (∑f/2 - S Ме-1)/f Ме = 250 + 50 * (510/2 - 170) / 115 = 286,96 тыс. руб.

Надеемся, наша статья оказалась полезной, и теперь вы имеете ясное представление о том, что такое медиана в статистике и как ее следует рассчитывать.

Центральную тенденцию данных можно рассматривать не только, как значение с нулевым суммарным отклонением (средняя арифметическая) или максимальную частоту (мода), но и как некоторую отметку (определенный уровень анализируемого показателя), делящую ранжированные данные (отсортированные по возрастанию или убыванию) на две равные части. То есть половина исходных данных по своему значению меньше этой отметки, а половина – больше. Это и есть медиана . Мода и медиана — важные показатели, они отражают структуру данных и иногда используются вместо средней арифметической.

Итак, медианна – это уровень показателя, который делит некоторый набор данных на две равные половины. В качестве демонстрационного примера вновь обратимся к набору случайных чисел. Такое распределение при большом количестве значений в литературе описывается, как обыденное явление. Вот данные в виде рисунка.

Очевидно, что при симметричном распределении середина, делящая совокупность пополам, будет находиться в самом центре – там же, где средняя арифметическая (и мода). Это, так сказать, идеальная ситуация, когда мода, медиана и средняя арифметическая совпадают и все их свойства приходятся на одну точку – максимальная частота, деление пополам, нулевая сумма отклонений – все в одном месте. Однако, жизнь не так симметрична, как нормальное распределение. Поэтому посмотрим на ассиметричное распределение, и что там происходит с центральными нашими тенденциями.

Допустим, мы имеем дело с техническими замерами отклонений от ожидаемой величины чего-нибудь (содержания элементов, расстояния, уровня, массы и т.д. и т.п.). Если все ОК, то отклонения, скорее всего, будут распределены по закону, близкому к нормальному, примерно, как на рисунке выше (практика подобное предположение опровергает, ну да ладно). Но если в анализируемом процессе присутствует какой-то существенный и неконтролируемый фактор, то в наблюдениях могут появиться аномальные значения, которые в значительной мере повлияют на среднюю арифметическую, но при этом почти не затронут медиану, что отчетливо видно на следующей гистограмме.

Медиана – это основная альтернатива средней арифметической, т.к. она устойчива к аномальным отклонениям (выбросам). В этой статье рассказывается о том, как ведет себя средняя арифметическая при аномальных значениях и как с этим бороться, то есть как сделать ее менее зависимой от выбросов. Основные варианты – это увеличение числа наблюдений и/или устранение аномалий из аналитической выборки. Так вот, переход от средней арифметической к медиане – еще один способ получить устойчивую (робастную) оценку математичечского ожидания. Другое дело, что свойства средней арифметической будут навсегда потеряны, но тут надо смотреть, что важней.

Теперь примеры реального использования медианы в статистике. При анализе средней заплаты по стране вместо средней арифметической могут задействовать медиану. Народу не нравится, когда их собственная з/п оказывается ниже средней (арифметической) по стране. Это вызывает бурю эмоций и разоблачений в неправильных подсчетах. Мол, у меня зарплата 100 рублей, а у директора 1000 рублей, вот и получается в среднем по 550 рублей. Что такое , недовольным гражданам неведомо и не интересно. А вот если использовать медиану, то будет понятно, что половина населения получает доход меньше медианного значения, а половина – больше.

Этот показатель также применяется в демографической статистике, при анализе различных количественных и качественных характеристик (прочность материала, содержание элементов, время работы, количество отказов и проч.). Даже трейдеры на forex используют медиану, как некоторый секретный сигнал к началу действий. Хотя большинство из них это не спасает.

Математическим свойством медианы является то, что сумма абсолютных (по модулю) отклонений от медианного значения дает минимально возможное значение, если сравнивать с отклонениями от любой другой величины. Даже меньше, чем от средней арифметической, о как! Данный факт находит свое применение, например, при решении транспортных задач, когда нужно рассчитать место строительства объекта около дороги таким образом, чтобы суммарная длина рейсов до него из разных мест была минимальной (остановки, заправки, склады и т.д. и т.п.). Логистам и на заметку.

{module 111}

Формула медианы для дискретных данных чем-то напоминает формулу моды. А именно тем, что формулы как таковой нет. Медианное значение выбирают из имеющихся данных и только, если это невозможно, проводят несложный расчет.

Первым делом данные ранжируют (сортируют по убыванию). Далее есть два варианта. Если количество значений нечетно, то медианна будет соответствовать центральному значению ряда, номер которого можно определить по формуле:

№ Me – номер значения, соответствующего медиане,

N – количество значений в совокупности данных.

Тогда медиана будет обозначаться, как

Это первый вариант, когда в данных есть одно центральное значение. Второй вариант наступает тогда, когда количество данных четно, то есть вместо одного есть два центральных значения. Выход прост: берется средняя арифметическая из двух центральных значений:

Так происходит поиск или расчет в дискретных данных. Однако данные могут быть еще и интервальными , где выбрать конкретное значение не представляется возможным, так как конкретных значений просто нет. Как и в моде, медиану в таком случае рассчитывают по некоторому общепринятому правилу, исходя из определенного предположения, то есть на глазок. И нормально получается, я вам скажу!

Для начала (после ранжирования данных) находят медианный интервал . Это такой интервал, через который проходит искомое медианное значение. Определяется с помощью накопленной доли ранжированных интервалов. Где накопленная доля впервые перевалила через 50% всех значений, там и медианный интервал.

Не знаю, кто придумал формулу медианы, но исходили явно из того предположения, что распределение данных внутри медианного интервала равномерное (т.е. 30% ширины интервала – это 30% значений, 80% ширины – 80% значений и т.д.). Отсюда, зная количество значений от начала медианного интервала до 50% всех значений совокупности (разница между половиной количества всех значений и накопленной частотой предмедианного интервала), можно найти, какую долю они занимают во всем медианном интервале. Вот эта доля аккурат переносится на ширину медианного интервала, указывая на конкретное значение, именуемое впоследствии медианой.

Не мудрствуя лукаво, лучше обратимся к наглядной схеме – понятней будет.

Немного громоздко получилось, но теперь, надеюсь, все наглядно и понятно. Чтобы при расчете каждый раз не рисовать такой график, можно воспользоваться готовой формулой. Формула медианы имеет следующий вид:

где x Me - нижняя граница медианного интервала;

i Me - ширина медианного интервала;

∑f/2 - количество всех значений, деленное на 2 (два);

S (Me-1) - суммарное количество наблюдений, которое было накоплено до начала медианного интервала, т.е. накопленная частота предмедианного интервала;

f Me - число наблюдений в медианном интервале.

Как нетрудно заметить, формула медианы состоит из двух слагаемых: 1 – значение начала медианного интервала и 2 – та самая часть, которая пропорциональна недостающей накопленной доли до 50%. Чем-то даже похоже на формулу моды. Отличие заключается в поиске точки внутри интервала.

Для примера рассчитаем медиану по следующим данным.

Требуется найти медианную цену, то есть ту цену, дешевле и дороже которой по половине количества товаров. Для начала произведем вспомогательные расчеты накопленной частоты, накопленной доли, общего количества товаров. Теперь еще раз посмотрим, что у нас имеется.

По последней колонке «Накопленная доля» определяем медианный интервал – 300-400 руб (накопленная доля впервые более 50%). Ширина интервала – 100 руб. Теперь остается подставить данные в приведенную выше формулу и рассчитать медиану.

То есть у одной половины товаров цена ниже, чем 350 руб., у другой половины – выше. Все просто. Средняя арифметическая, рассчитанная по этим же данным, равна 355 руб. Отличие не значительное, но оно есть.

Расчет медианы в Excel

Статистика без автоматических расчетов – прошлый век. Медиану чисел легко найти, используя функцию Excel, которая так и называется — МЕДИАНА. Используется архипросто. Активируется ячейка для расчета, вызывается функция, выбирается диапазон данных и «ОК». Больше и обсуждать нечего. Годится и для четного, и для нечетного количества данных.

Другое дело интервальные данные. Соответствующей функции в Excel нет. Поэтому нужно задействовать приведенную выше формулу. Что поделаешь? Но это не очень трагично, так как расчет медианы по интервальным данным – редкий случай. Можно и на калькуляторе разок посчитать.

Кстати, тот факт, что медиана делит данные на две равные части, напоминает о некоторых методах группировки. Действительно, после нахождения медианы, мы также получаем две группы с равным количеством значений. Развивая эту идею, деление на группы можно производить не только по принципу 50/50, но и по другим долям. Например, 20% наибольших значений есть не что иное, как группа А в ABC-анализе . О других долях как-нибудь в другой статье. Видите, как пересекаются, казалось бы, не связанные методы?

Подходит к концу мой рассказ о статистическом показателе медиана. Надеюсь, он был неутомительным. Напоследок предлагаю задачку в стиле телевикторины «Кто хочет стать миллионером?». Имеется набор данных. 15, 5, 20, 5, 10. Каково среднее значение? Четыре варианта:

Предлагаю также посмотреть видеролик на тему расчета медианы в Excel.

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 4 .

Расчёт структурных характеристик вариационного ряда распределения.

Студент должен:

знать:

- область применения и методику расчёта структурных средних величин;

уметь:

- исчислять структурные средние величины;

- формулировать вывод по полученным результатам.

Методические указания

В статистике исчисляются мода и медиана, которые относятся к структурным средним, так каких величина зависит от строения статистической совокупности.

Расчёт моды

Модой называется значение признака (варианта), чаще всеговстречающееся в изучаемой совокупности. В дискретном ряду распределения модой будет варианта с наибольшей частотой.

Например : Распределение проданной женской обуви по размерам характеризуется следующим образом:

Размер обуви

Количество проданных пар

В этом ряду распределениямодой является 37 размер, т.е. Мо=37 размер .

Для интервального ряда распределения мода определяется по формуле:

где Х Mo - нижняя граница модального интервала;

h Mo - величина модального интервала;

f Mo – частота модального интервала;

f Mo -1и f Mo +1 – частота интервала соответственно

предшествующего модальному и следующего за ним.

Например : Распределение рабочих по стажу работы характеризуется следующими данными.

Стаж работы, лет

до 2

8-10

10 и более

Число рабочих, чел.

Определить моду интервального ряда распределения.

Мода интервального ряда составляет

Мода всегда бывает несколько неопределённой, т.к. она зависит от величины групп и точного положения границ групп. Мода широко применяется в коммерческой практике при изучении покупательского спроса, при регистрации цен и т.п.

Расчёт медианы

Медианой в статистике называется варианта, расположенная в середине упорядоченного ряда данных, и которая делит статистическую совокупность на две равные части так, что у одной половины значения меньше медианы, а у другой половины – больше её. Для определения медианы необходимо построить ранжированный ряд, т.е. ряд в порядке возрастания или убывания индивидуальных значений признака.

В дискретном упорядоченном ряду с нечётным числом членов медианой будет варианта, расположенная в центре ряда.

Например : Стаж пяти рабочих составил 2, 4, 7, 9 и 10 лет. В таком ряду медиана-7 лет, т.е. Ме=7 лет

Если дискретный упорядоченный ряд состоит из чётного числа членов, то медианой будет средняя арифметическая из двух смежных вариант, стоящих в центре ряда.

Например : Стаж работы шести рабочих составил 1, 3, 4, 5, 10 и 11лет. В этом ряду имеются две варианты, стоящие в центре ряда. Это варианты 4 и 5. Средняя арифметическая из этих значений и будет медианой ряда

Чтобы определить медиану для сгруппированных данных, необходимо считать накопленные частоты.

Например: По имеющимся данным определим медиану размера обуви

Размер обуви

Количество проданных пар

Сумма накопленных частот

8+19=27

27+34=61

61+108=169

Итого

Для определения медианы надо подсчитать сумму накопленных частот ряда. Наращивание итога продолжается до получения накопленной суммычастот, превышающей половину суммы частот ряда. В нашем примере сумма частот составила 300, её половина – 150. Накопленная сумма частот получилась равной 169. Варианта, соответствующая этой сумме, т.е. 37 и есть медиана ряда.

Если же сумма накопленных частот против одной из вариант равна точно половине суммы частот ряда, то медиана определяется как средняя арифметическая этой варианты и последующей.

Например : По имеющимся данным определим медиану заработной платы рабочих

Месячная заработная плата, тыс.р уб.

Число рабочих, чел.

Сумма накопленных частот

14,0

14,2

2+6=8

16,0

8+12=20

16,8

18,0

Итого:

Медиана будет равна:

Медиана интервального вариационного ряда распределения определяется по формуле:

ГдеХ Ме – нижняя граница медианного интервала;

h Me – величина медианного интервала;

f - сумма частот ряда;

f Ме – частота медианного интервала;

Например: По имеющимся данным о распределении предприятий по численности промышленно – производственного персонала рассчитать медиану в интервальном вариационном ряду

Число предприятий

Сумма накопленных частот

100-200

200-300

1+3=4

300-400

4+7=11

400-500

11+30=41

500-600

600-700

700-800

Итого:

Определим, прежде всего, медианный интервал. В данном примере сумма накопленных частот, превышающих половину суммы всех значений ряда, соответствует интервалу 400-500.Это и есть медианный интервал, т.е. интервал, в котором находится медиана ряда. Определим её значение

Если же сумма накопленных частот против одного из интервалов равна точно половине суммы частот ряда, то медиана определяется по формуле:

где n – число единиц в совокупности.

Например: По имеющимся данным о распределении предприятий по численности промышленно – производственного персонала рассчитать медиану в интервальном вариационном ряду

Группы предприятий по численности ППП, чел.

Число предприятий

Сумма накопленных частот

100-200

200-300

1+3=4

300-400

4+6=10

400-500

10+30=40

500-600

40+20=60

600-700

700-800

Итого:

чел

Моду и медиану в интервальном ряду можно определить графически:

моду в дискретных рядах - по полигону распределения, моду в интервальных рядах - по гистограмме распределения, а медиану - по кумуляте .

Мода интервального ряда распределения определяется по гистограмме распределения определяют следующим образом. Для этого выбирается самый высокий прямоугольник, который является в данном случае модальным. Затем правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс. Абсцисса точки пересечения этих прямых и будет модой распределения.

Медиана рассчитывается по кумуляте . Для её определения из точки на шкале накопленных частот (частостей ), соответствующей 50%, проводится прямая , параллельная оси абсцисс, до пересечения с кумулятой . Затем из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является медианой.

Кроме моды и медианы в вариантных рядах могут быть определены и другие структурные характеристики – квантили. Квантили предназначены для более глубокого изучения структуры ряда распределения.

Квантиль – это значение признака, занимающее определенное место в упорядоченной по данному признаку совокупности. Различают следующие виды квантилей:

- квартили – значения признака, делящие упорядоченную совокупность на четыре равные части;

- децили – значения признака, делящие упорядоченную совокупность на десять равных частей;

- перцентели - значения признака, делящие упорядоченную совокупность на сто равных частей.

Таким образом, для характеристики положения центра ряда распределения можно использовать 3 показателя: среднее значение признака , мода, медиана . При выборе вида и формы конкретного показателя центра распределения необходимо исходить из следующих рекомендаций:

- для устойчивых социально-экономических процессов в качестве показателя центра используют среднюю арифметическую. Такие процессы характеризуются симметричными распределениями, в которых ;

- для неустойчивых процессов положение центра распределения характеризуется с помощью Mo или Me . Для асимметричных процессов предпочтительной характеристикой центра распределения является медиана, поскольку занимает положение между средней арифметической и модой.