Группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов.

Вторичная группировка, или перегруппировка сгруппированных данных, применяется для лучшей характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок в целях проведения сравнительного анализа.

Вторичная группировка - это операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаще укрупнение) первоначальных интервалов. Второй способ получил название долевой перегруппировки. Он состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Проиллюстрируем методику вторичной группировки на примере (табл. 3.14).

Таблица 3.14. Распределение предприятий розничной торговли одного из городов Московской области по среднегодовой численности работников в 2011 г.*

* Данные условные.

Произведем перегруппировку данных, образовав новые группы с интервалами до 5, 5-10, 10-20, 20-30, 30 и более человек.

В первую новую группу войдет полностью первая группа предприятий розничной торговли и часть второй группы. Чтобы образовать группу до пяти человек, необходимо от интервала второй группы взять одного человека. Величина интервала этой группы составляет шесть человек. Следовательно, необходимо взять от нее 1/6 часть. Аналогичную же часть во вновь образуемую первую группу надо взять и от числа предприятий, т.е. 20 -= 3 предприятия. 6

Тогда в первой группе предприятий розничной торговли будет 16 + 3 = 19 ед.

Вторую новую группу образуют предприятия розничной торговли второй группы за вычетом отнесенных к первой, т.е. 20 - 3 = 17 предприятий. Во вновь образованную третью группу войдут все предприятия третьей группы и часть предприятий четвертой. Для определения этой части от интервала 18 30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 20 человек). Следовательно, необходимо взять часть интервала, равную 2/12 = 1/6. В этой группе 74 предприятия, значит надо взять 74 (1/6) = 12 предприятий. В новую третью группу войдут 44 + 12 = 56 предприятий.

Во вновь образованную четвертую группу войдут 74 - 12 = = 62 предприятия, оставшиеся от прежней четвертой группы. Пятую вновь образованную группу составят предприятия розничной торговли пятой и шестой прежних групп: 37 + 9 = 46 предприятий.

В результате получим новые группы (табл. 3.15).

Таблица 3.15. Распределение предприятий розничной торговли одного из городов Московской области по среднегодовой численности работников в 2011 г. после перегруппировки данных*

* Данные условные.

Статистическая таблица: сущность, элементы и классификация

Статистическая таблица - наиболее рациональная, наглядная и компактная форма представления статистического материала, в том числе результатов статистической группировки. Однако не всякая таблица является статистической. Таблица умножения, опросный лист социологического обследования могут носить табличную форму, но еще не являются статистическими таблицами.

Статистическая таблица - это таблица, которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа.

Основные элементы статистической таблицы, составляющие ее остов (основу), показаны на схеме 3.1.

Табличной называется такая форма расположения числовой информации, при которой число располагается на пересечении четко сформулированного заголовка по вертикальному столбцу, называемому графой, и названия по соответствующей горизонтальной полосе - строке. Таким образом, внешне таблица представляет собой пересечение граф и строк, которые формируют остов таблицы.

Статистическая таблица содержит три вида заголовков: общий, верхние и боковые. Общий заголовок отражает содержание всей таблицы (к какому месту и времени она относится), располагается над макетом таблицы по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) - строк. Они служат внутренними заголовками.

Остов таблицы, заполненный заголовками, образует макет таблицы; если на пересечении граф и строк записать цифры, то получается полная статистическая таблица. Название таблицы (общий заголовок)

Схема 3.1. Остов (основа) статистической таблицы

Цифровой материал может быть представлен абсолютными (уставный капитал, объем инновационных товаров и т.д.), относительными (ВВП на душу населения, число персональных компьютеров на 100 работников и т.д.) и средними (средний курс акций, средний надой молока на одну корову и т.д.) величинами.

Таблицы могут сопровождаться примечанием, используемым для пояснения, в случае необходимости, заголовков, методики расчета некоторых показателей, источников информации и т.д.

По логическому содержанию таблица представляет собой "статистическое предложение", основными элементами которого являются подлежащее и сказуемое.

Подлежащим называется объект, который характеризуется цифрами. Это может быть одна или несколько совокупностей, отдельные единицы совокупности в порядке их перечня или сгруппированные по каким-либо признакам, территориальные единицы и т.д. Обычно подлежащее таблицы дается в левой части, в наименовании строк.

Сказуемое образует система показателей, которыми характеризуется объект изучения, т.е. подлежащее таблицы. Сказуемое формирует верхние заголовки и составляет содержание граф с логически последовательным расположением показателей слева направо.

Расположение подлежащего и сказуемого в отдельных случаях может меняться местами для более полного и лучшего способа прочтения и анализа исходной информации об исследуемой совокупности.

По структуре подлежащего, в зависимости от группировки единиц в нем, различают простые и сложные статистические таблицы.

Простой называется статистическая таблица, в подлежащем которой дается перечень объектов или территориальных единиц. Простые статистические таблицы подразделяются на монографические и перечневые.

Монографические таблицы характеризуют не всю совокупность единиц изучаемого объекта, а только одну какую-либо единицу или группу, выделенную по определенному признаку (табл. 3.16).

Таблица 3.16. Ввод в действие объектов социально-культурного назначения в субъектах РФ в 2009 г.

Перечневыми таблицами называются таблицы, подлежащее которых содержит перечень объектов или единиц изучаемого объекта (табл. 3.17).

Сложные статистические таблицы в отличие от простых дают возможность выявить социально-экономические типы изучаемых явлений, их структуру, а также взаимосвязи и взаимозависимости между характеризующими их признаками. Эти задачи более полно могут быть решены с помощью групповых и, особенно, комбинационных таблиц.

Групповыми называют статистические таблицы, подлежащее которых содержит группировку единиц совокупности по одному количественному или атрибутивному признаку.

Простейшим видом групповых таблиц являются ряды распределения. Групповая таблица может быть более сложной, если в сказуемом дополнительно приводится ряд показателей, характеризующих группы подлежащего. Такие таблицы часто используются в целях сопоставления обобщающих показателей по группам (табл. 3.18).

Таблица 3.17. Поступление иностранных инвестиций в экономику РФ но основным странам-инвесторам в 2009 г.

Группа населения по возрасту, лет

Всего

В том числе

мужчины

женщины

Таким образом, групповые таблицы позволяют выявить и охарактеризовать социально-экономические типы явлений, их структуру в зависимости только от одного признака.

Комбинационными называют статистические таблицы, подлежащее которых содержит группировку единиц совокупности одновременно по двум и более признакам: каждая из групп, построенная по одному признаку, разбивается, в свою очередь, на подгруппы по какому-либо другому признаку и т.д. (табл. 3.19).

Таблица 3.19. Группировка построенных квартир в жилом доме по количеству комнат и среднему размеру

Таблица 3.18. Распределение численности занятых в экономике РФ по возрастным группам на конец ноября 2009 г., % к итогу

Подлежащим в таблице являются группы построенных квартир по количеству комнат и их среднему размеру.

Комбинационные таблицы позволяют характеризовать типические группы, выделенные по нескольким признакам, и связь между ними. Последовательность разбиения единиц совокупности на однородные группы по признакам определяется либо важностью одного из них в комбинации, либо порядком их изучения.

В сказуемом статистической таблицы, как уже говорилось, приводятся показатели, которые являются характеристикой изучаемого объекта.

По структуре сказуемого различают простые и сложные статистические таблицы.

При простой разработке сказуемого представленные в нем признаки не пересекаются и итоговые значения получаются путем простого суммирования значений по каждому признаку отдельно, независимо друг от друга. Примером простой разработки сказуемого может служить табл. 3.20.

При сложной разработке сказуемого получается более полная и подробная характеристика объекта. В этом случае оба признака сказуемого (по полу и по возрасту) тесно связаны друг с другом. Можно сначала проанализировать состав Государственной Думы в разрезе фракций

Таблица 3.20.

по возрастным группам, а затем каждую возрастную группу разделить на две подгруппы по полу. Иными словами, при сложной разработке сказуемого явление или объект могут быть охарактеризованы различной комбинацией признаков, формирующих их.

Во всех случаях исследователь при построении статистических таблиц должен руководствоваться оптимальным соотношением показателей сказуемого.

Основные правила построения и анализ статистических таблиц

Статистические таблицы как средство наглядного и компактного представления цифровой информации должны быть статистически правильно оформлены. Существуют следующие основные приемы, определяющие технику формирования статистических таблиц.

  • 1. Цифровой материал необходимо излагать таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением строк слева направо и сверху вниз.
  • 2. Заголовок таблицы и названия граф и строк должны быть четкими, лаконичными, представлять собой законченное целое, органично вписывающееся в содержание текста. В названии таблицы должны найти отражение объект, признак, время и место совершения события.
  • 3. Информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой.
  • 4. Если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то необходимо им присвоить объединяющий заголовок.
  • 5. Графы и строки полезно нумеровать. Графы слева, заполненные названием строк, принято обозначать заглавными буквами алфавита (А), (Б) и т.д., а все последующие графы - номерами в порядке возрастания.
  • 6. Взаимосвязанные данные, характеризующие одну из сторон анализируемого явления, целесообразно располагать в соседних друг с другом графах.
  • 7. Графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям. При этом используются общепринятые сокращения единиц измерения (руб., кВт ч и т.д.).
  • 8. Числа целесообразнее по возможности округлять. Округление чисел в пределах одной и той же графы или строки следует проводить с одинаковой степенью точности.
  • 9. В случае необходимости дополнительной информации (разъяснений к таблице) могут даваться примечания.

Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представления, обработки и обобщения статистической информации о состоянии и развитии анализируемых социально-экономических явлений.

Анализ статистических таблиц проводится в двух направлениях: структурный и содержательный.

Структурный анализ предполагает разбор строения таблицы и характеристику:

  • совокупности и единиц наблюдения, формирующих ее;
  • признаков и их комбинаций, формирующих подлежащее и сказуемое таблицы;
  • вида таблицы;
  • решаемых задач.
  • анализ отдельных групп подлежащего по соответствующим признакам сказуемого;
  • выявление соотношений и пропорций между группами явлений по признакам;
  • сравнительный анализ и формулировку выводов, установление закономерностей и определение резервов развития изучаемого объекта.

Анализ отдельных признаков и групп необходимо начинать с изучения абсолютных величин, затем - связанных с ними относительных величин.

Если этого требуют задачи исследования, то анализ таблиц может быть дополнен расчетными относительными и средними величинами, графиками, диаграммами и т.д.

Анализ данных таблиц производится по каждому признаку в отдельности, а затем в логико-экономическом сочетании признаков.

Соблюдение правил и последовательности работы со статистическими таблицами позволит исследователю осуществить комплексный научно обоснованный экономико-статистический анализ изучаемых объектов и процессов.

  • Суть и виды статистических группировок.
  • Выполнение группировки по количественному признаку.
  • Ряды распределения, их виды и графическое изображение.

Суть и виды статистических группировок

В результате первой стадии статистических исследований (статистического наблюдения) получают статистическую информацию , представляющую собой большое количество первичных, разрозненных сведений об отдельных единицах объекта исследования (например, записи о каждом гражданине страны при переписи населения: пол, национальность, возраст, образование и др.).

Дальнейшая задача статистики заключается в этом, чтобы привести эти материалы в определенный порядок, систематизировать и на этой основе дать сводную характеристику всей совокупности фактов для того, чтобы изучить характерные черты и отличительные особенности изучаемого явления и выявить закономерности его развития. Это достигается на второй стадии статистического исследования, первой ступенью которой является статистическая сводка.

Статистическая сводка – это научно организованная обработка первичных данных в целях получения обобщающих характеристик изучаемого явления по ряду существенных для него признаков.

Если производится только подсчет общих итогов по изучаемой совокупности единиц наблюдения, то сводка называется простой. Например: чтобы узнать общую численность студентов высших учебных заведений Украины достаточно сложить количество студентов всех ВУЗов на определенную дату.
Статистическая сводка включает в себя такие составляющие элементы:

  • выбор группировочных признаков (например, после переписи население можно делить на группы по признакам: пол, возраст, национальность);
  • распределение данных на части (группы и подгруппы);
  • расчет итоговых групповых данных с помощью системы статистических показателей.
  • систематизация полученных результатов в виде статистических таблиц.

Объединение отдельных единиц статистической совокупности в группы осуществляется при помощи метода группировок.

Статистическая группировка – это процесс образования однородных групп по ряду существенных признаков. Осуществляется группировка либо путем деления совокупности на отдельные части, которые характеризуются внутренней однородностью и отличаются рядом признаков, либо путем объединения отдельных единиц в группы по типовым признакам (например, группировка промышленных предприятий по форме собственности, группировка населения по размеру среднедушевого дохода, группировка коммерческих банков по сумме актива баланса и т.д.).

Признаки, по которым производится распределение единиц изучаемой совокупности на группы, называются группировочными признаками или основанием группировки . Если группировка получена по количественному признаку, она называется количественной, по качественному – атрибутивной или качественной.
На группировку в статистическом анализе возлагаются следующие функции:

  • выделение социально-экономических типов явлений;
  • изучение структуры и структурных сдвигов;
  • анализ взаимосвязей между явлениями.

В соответствии с этими функциями различают типологические, структурные и аналитические (факторные) группировки.
Типологическая группировка – это распределение качественно разнородной совокупности на классы, социально-экономические однородные типы. К этому виду относятся группировки стран по социально-политическому устройству, предприятий – по форме собственности, населения – по месту проживания (городское и сельское).

Разделение однородной совокупности на группы с целью выявления ее внутренней структуры называется структурной группировкой. Она характеризует состав совокупности, объем (весомость) ее отдельных групп.
Таблица 1 – Группировка потребителей йогурта по возрасту

Анализ структурных группировок, взятых за ряд периодов или моментов времени, показывает изменение структуры изучаемых явлений, т.е. структурные сдвиги , что отражает закономерности их развития.

Аналитические группировки используются для исследования наличия зависимости между изучаемыми явлениями. Для этого следует данные сгруппировать по одному из признаков, вычислить в каждой группе среднее значение второго признака, а затем сопоставить изменения изучаемых признаков. Если с увеличением или уменьшением группировочного признака увеличиваются значения второго признака, то связь (прямая или обратная) между ними существует.
Таблица 2 – Группировка магазинов по численности работников (данные условные)


Численность работников, чел.

Количество магазинов

Средняя фактическая продолжительность рабочей недели, ч.

100 и более

Данные показывают, что между размером предприятия и занятостью его работников существует связь: чем больше по количеству работающих магазин, тем короче рабочая неделя.

Если группы, образованные по одному признаку, делятся затем на группы по второму и т.д. признакам, то такая группировка называется комбинированной . Например, распределив группы потребителей йогурта по полу, получим комбинированную группировку.
Таблица 3 – Группировка потребителей йогурта по возрасту и полу

Группы потребителей по возрасту, лет

Число потребителей, чел.

мужского пола

женского пола

Менее 20
20-30
30-40
40-50
50-60
Старше 60

10
40
30
10
6
4

4
17
12
6
3
1

6
23
18
4
3
3

Выполнение группировки по количественному признаку

При составлении структурных группировок на основе количественных признаков определяют количество групп и интервалы группировки .

Интервал – количественное значение, определяющее и отделяющее одну группу от другой, т.е. он очерчивает количественные границы групп.
Интервалы могут быть равные и неравные. Например: по численности работающих предприятия могут быть разбиты на группы: до 100, 100-200, 200-500, 500-1000, 1000 и более. Это объясняется тем, что изменение признака на 50-100 чел. имеет существенное значение для мелких предприятий, а для крупных – не имеет.
Для группировок с равными интервалами величина (длина, шаг) интервала определяется по формуле:

,
где ,– наибольшее и наименьшее значение признака;
к – число групп (интервалов), определяемое по формуле Стерджесса:

,

где N – число единиц совокупности.
Округление полученных в расчетах нецелых чисел производится в большую сторону.
Например: необходимо произвести группировку с равными интервалами 20 рабочих цеха по производительности их труда. Наибольшая производительность 180 деталей за смену, наименьшая – 60.
Количество групп:
Длина интервала: дет.
Нижняя граница 1-ой группы 60 деталей, верхняя 60+20=80 деталей. Вторая группа: нижняя граница 80, верхняя 80+20=100 и т.д. В результате получаем такой интервальный ряд (или такие группы рабочих), деталей:

1 группа: 60-80
2 группа: 80-100
3 группа: 100-120
4 группа: 120-140
5 группа: 140-160
6 группа: 160-180

В этом распределении имеется неопределенность, к какой группе отнести единицу совокупности, значение признака которой равно граничному значению интервала (рабочих с производительностью 80, 100, 200 и т. д. дет/см). Для устранения неопределенности используют принцип единообразия: левая, нижняя граница интервала включает в себя указанное значение, а верхняя – нет. Значит, рабочего, производящего 100 дет/см, относят к 3 группе.

Интервалы групп могут быть закрытыми , когда указаны верхняя и нижняя границы (как в примере), и открытыми , когда указана лишь одна из границ. Например, интервалы «менее 60» или «180 и выше» - открытые интервалы. Для расчета показателей статистической совокупности открытые интервалы необходимо «закрыть». Для этого используют величину интервала, соседнего с «открытым». В примере получим: 40-60 и 180-200.

Сказанное выше относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но довольно часто приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, группировки могут быть не сопоставимы из-за различного числа групп или неодинаковых границ интервалов. Для приведения группировок к сопоставимому виду используется метод вторичной группировки , который заключается в образовании новых групп на основе ранее осуществленной группировки. Эта перегруппировка возможна двумя способами: 1) объединением первоначальных интервалов (т.е. их укрупнением); 2) долевой перегруппировкой.
Рассмотрим пример, данные условные.

Таблица 3 – Группировка акционеров по размеру дивидендов на одну акцию.


1-й район

№ груп-пы

Количество акционеров, %

№ груп-пы

Группы акционеров по размеру диви-дендов, грн.

Количество акционеров, %

1
2
3
4
5

1 – 4
4 – 8
8–12
12–16
16–20

18
12
40
25
5

1
2
3
4

1– 6
6–12
12–20
20–30

10
20
40
30

Приведенные данные не позволяют сравнить распределение акционеров двух районов по размеру дивидендов из-за различного числа групп (5 и 4) и различной длины интервала. Взяв за основу группировку 2-го района (как более крупную), произведем вторичную группировку акционеров 1-го района.

Таблица 4 – Вторичная группировка акционеров по размеру дивидендов на 1 акцию


№ груп-пы

Группы акционеров по размеру дивидендов, %

Количество акционеров, %

1
2
3
4

1 – 6
6–12
12–20
20–30

10
20
40
30

24
46
30

18+0,5*12=24
0,5*12+40=46
25+5=30

Анализ сопоставимых данных вторичной группировки позволяет сделать вывод: акционеры второго района имеют более высокие дивиденды: (12 и выше грн. получают 40+30=70 % акционеров, а в первой – только 30 %).

Ряды распределения, их виды и графическое изображение

Статистический ряд распределения – это упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку (предыдущий пример – это ряд распределения). Он, являясь разновидностью структурной группировки, характеризует состав (или структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Ряды распределения, построенные по атрибутивному признаку, называются атрибутивными (распределение населения по полу, занятости, профессии и т.д.).
Ряды, построенные по количественному признаку, - вариационными (распределение населения по стажу работы, з/п, возрасту.).

Конструктивно вариационный ряд распределения представляет собой таблицу, в первом столбце которой расположены варианты или их интервалы, во второй – частоты или (и) частости (третий столбец) . Принято варианты обозначать, частоты - , частости - .
Варианты, т.е. числовые значения количественного признака в вариационном ряду распределения, могут быть положительными или отрицательными. Так, при группировке предприятий по результатам деятельности варианты положительные (прибыль) или отрицательные (убыток).

Частоты это числа, показывающие, как часто встречаются те или варианты в данной совокупности. Сумма всех частот называется объемом совокупности и показывает число единиц совокупности, обозначается N.

Частости это частоты, выраженные в виде относительных величин: долях единицы или в процентах, рассчитываются как отношение частоты к объему совокупности. Сумма частостей всегда равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.
Для анализа совокупности вариационный ряд дополняют такими элементами, как накопленная частота, накопленная частость и плотность распределения.

Накопленная частота (Sf)показывает число единиц совокупности, у которых значение варианты не больше данной, определяется суммированием частот всех предшествующих интервалов, включая данный:

, , и т.д.

Если вместо частот использовать частости, то аналогично получим накопленные частости (Sw):

, , и т.д.

Абсолютная плотность распределения – это частота, приходящаяся на единицу длины интервала, т. е. , а относительная плотность распределения – частость, приходящаяся на единицу длины интервала, т. е. . Плотность распределения используется в рядах с неравными интервалами для приведения частот и частостей к сопоставимому виду.
Вариационные ряды в зависимости от характера вариации делят на дискретные и интервальные.
Дискретные вариационные ряды строятся на основе дискретных (прерывных) признаков. Дискретные – это признаки, варианты которых имеют только целые значения и количество их невелико. Интервальные вариационные ряды основаны на непрерывных признаках (т.е. принимающих любые значения, в том числе и дробные) или дискретных, варьирующих в широком диапазоне.

Пример построения дискретного ряда распределения . Стаж работы в годах 10 рабочих бригады характеризуются следующими данными: 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.
Первым шагом в упорядочении первичного ряда является его ранжирование , т.е. расположение всех вариант в возрастающем или убывающем порядке.
Ранжированный ряд: 2, 3, 3, 4, 4, 4, 4, 5, 5, 5.

Таблица 5 – Дискретный вариационный ряд распределения рабочих по стажу работы


Стаж
работы (варианты хi)

Количество рабочих определенного стажа (частота fi)

Частости

Накопленные частоты

Накопленные частости

2
3
4
5

1
2
4
3

(1:10)*100=10
(2:10)*100=20
40
30

1
1+2=3
3+4=7
7+3=10

10
30
70
100

Пример построения интервального ряда . Имеются данные о среднемесячной з/п 30 работников, которая варьируется от 600 до 1200 грн. Построить интервальный ряд распределения.

Таблица 6 – Интервальный вариационный ряд распределения рабочих по размеру среднемесячной заработной платы

Группы рабочих по размеру з/п (интервалы вариант хi)

Количество рабочих (частоты fi)

Частости

Накопленные частоты

Накопленные частости

1) 600-700
2) 700-800
3) 800-900
4) 900-1000
5) 1000-1100
6) 1100-1200

3
6
8
9
3
1

26,7
30
10
3,3

3
3+6=9
9+8=17
26
29
30

10,0
30,0
56,7
86,7
96,7
100,0

Графически ряды распределения можно представить в виде гистограммы, кумуляты, полигона.
Интервальный вариационный ряд изображают в виде гистограммы . Для ее построения в прямоугольной системе координат по оси абсцисс откладывают отрезки, равные длине интервала. Затем на этих отрезках, как на основаниях, строят прямоугольники, высота которых пропорциональна частоте или частости. Для интервального ряда с неравными интервалами по оси ординат откладывают плотность распределения, так как в этом случае именно она дает представление о заполненности интервала. Площадь всей гистограммы численно равна сумме частот.
Пример построения гистограммы.

Если соединить середины каждого интервала отрезками прямой, то получим замкнутую фигуру в виде многоугольника, которая называется полигоном .
Полигон чаще используется для дискретных рядов. Для этого в прямоугольной системе координат строят точки с координатами (x1, f1), (x2, f2), …, (xN, fN), затем последовательно соединяют их отрезками, а из первой и последней точек опускают перпендикуляры на ось х. Полученный многоугольник является полигоном дискретного вариационного ряда.

Кумулята строится по накопленным частотам (или частостям), которые откладывают по оси у, а по оси х – варианты или верхние границы интервалов.

Сложные группировки. Группировки по одному признаку называются простыми . Для того же, чтобы полнее и глубже изучить сложное общественное явление, необходимо сгруппировать данные по двум или более признакам. Такие группировки называют сложными .

Наиболее распространенным видом сложных группировок являются комбинированные группировки , когда группы, образованные по одному признаку, делятся затем на подгруппы по второму и т.д. признакам. Обычно в основание группировки кладется от 2 до 4 признаков.

Одновременное использование нескольких группировочных признаков позволяет выявить и сравнить такие различия и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированной группировки по ряду группировочных признаков.

При изучении влияния большого числа признаков применение комбинированных группировок становится невозможным, поскольку чрезмерное дробление информации затушевывает проявление закономерностей и тем самым не позволяет выявить одновременное влияние всего комплекса факторных признаков на исследуемый показатель.

Вторичная группировка. Особым видом группировок в статистике является вторичная группировка , под которой понимается образование новых групп на основе ранее выделенной (первичной) группировки .

Обычно новые группы получают путем укрупнения первоначальных интервалов. Вторым способом образования новых групп является долевая перегруппировка единиц совокупностей.

К вторичной группировке прибегают в целях решения ряда задач, в частности для: 1) создания более укрупненных групп, в которых яснее проступает характер распределения; 2) образования качественно однородных групп (типов); 3) приведения двух (или более) группировок с различными интервалами к единому виду в целях сравнимости.

Предприятие 1 Предприятие 2
группы рабочих по размеру зарплаты, тенге удельный вес рабочих по группам, % к итогу
12000–14000
14000–16000 13000–16000
16000–18000 16000–19000
18000–20000 19000–22000
20000–22000 22000–25000
22000–24000 25000–28000
24000–26000 28000–31000
26000–28000
Итого Итого

Поскольку распределение рабочих на этих двух предприятиях имеет различные интервалы, то сравнить их непосредственно невозможно. Однако с помощью вторичной группировки можно привести их к сравнимому виду. Возьмем, к примеру, интервал в 4000 тенге:

Распределение рабочих по размеру месячной заработной платы

(группировка единая)

Группы рабочих по размеру зарплаты, тенге Удельный вес рабочих по группам, % к итогу
предприятие 1 предприятие 2
12000–16000 17 (5+12)
16000–20000 44 (18+26) 37 (30+1/3×21)
20000–24000 32 (25+7) 24 (2/3×21+2/3×15)
24000–28000 7 (4+3) 21 (1/3×15+16)
28000–32000
Всего

Ряды распределения.

Определение ряда распределения. В результате сводки статистических материалов образуются ряды статистических данных, раскрывающих либо изменение объемов совокупностей в динамике (будут рассмотрены в отдельной главе), либо распределение совокупностей по тем или иным признакам в статике.

Распределение может быть по признакам, не имеющим количественной меры (атрибутивным), и по признакам, в которых изменяется их количественная мера (вариационные ряды).

Атрибутивные ряды распределения. Примерами подобных распределений служат распределение населения на городское и сельское, мужское и женское, товарооборота на продовольственные и непродовольственные товары, занятого населения по отраслям и профессиям, взрослого населения по уровню образования.

Вариационные ряды. Например, к таким рядам относятся распределения рабочих по размеру среднемесячной заработной платы и предприятий по объемам производства или численности работающих.

В вариационном ряду различают два элемента: варианты и частоты. Варианты это отдельные значения группировочного признака, которые он принимает в вариационном ряду. Частотами называют числа, показывающие, как часто встречаются те или иные варианты.

Сумма всех частот образует объем ряда распределения, или его численность . Частоты, выраженные в виде относительных величин (долях единицах, процентах), называют частостями .

Вариационные ряды по способу построения бывают интервальными и дискретными. Интервальные вариационные ряды – ряды, в которых значения вариант даны в виде интервалов (например, численность населения по группам возрастов). Дискретные вариационные ряды – ряды, в которых значения вариант имеют значения целых или фиксированных чисел (например, общее число семей по числу человек).

Характер вариационного ряда (интервальный или дискретный) определяется характером вариации. Вариация может быть непрерывной (интервальный ряд) и прерывной (дискретный ряд).

Примерами непрерывной вариации служат урожайность сельскохозяйственных культур, заработная плата, объемы производства.

К дискретной вариации могут относиться число членов семьи, тарифный разряд рабочего, число комнат в квартире, число рабочих на предприятии.

Если дискретная вариация проявляется в широких пределах (например, численность рабочих на предприятии), то строятся интервальные вариационные ряды.

Примеры построения и графического изображения рядов распределения (Тарифный разряд и стаж работы рабочих-слесарей). Построим первоначальный дискретный ряд распределения рабочих по тарифным разрядам. Характер вариации признака здесь определен шестью группами – по числу разрядов. Подсчет числа рабочих в каждом разряде легко провести непосредственно по первичным данным. В результате получим таблицу.

Вторичная группировка

На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.

Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.

Во вторичной группировке применяются два способа образования новых групп:

  • § Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.
  • § Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.

Ряды распределения

Группировка может быть построена на основе ряда распределения. В то же время построение рядов может осуществляться на основе группировки. Всестороннее изучение статистического явления наиболее плодотворно, если в его основе лежит система группировок. Система группировок - это ряд взаимосвязанных статистических группировок по наиболее существенным признакам, всесторонне отражающим важнейшие стороны явления.

Рядом распределения называется упорядоченное распределение единиц совокупности на группы по какому-либо признаку.

Виды рядов распределения:

  • - атрибутивный;
  • - вариационный - дискретный и интервальный.

Иными словами, ряд распределения - результат группировки.

Под атрибутивным рядом понимается ряд распределения по атрибутивному признаку, не имеющему количественной меры. Например, атрибутивный ряд можно составить по признаку «Социальное положение», «Профессия», «Пол» и т.д.

Любой ряд, представленный в табличном виде, состоит из двух колонок. В первой колонке указываются значения изучаемого признака (атрибутивные или количественные). Во второй колонке фиксируется число единиц наблюдения, обладающих данным значением. Таким образом, построение вариационного ряда сводится к определению значения признака в каждой классификационной группе и определению количества элементов, попавших в эту группу.

Каждое индивидуальное значение признака в ряду распределения называется вариантой.

Количество элементов в каждой классификационной группе или количество элементов в совокупности с данной вариантой называется частотой, или, иначе, число единиц наблюдения, содержащееся в каждой отдельной группе, принято называть частотой ряда распределения.

Удельный вес данной группы в совокупности называется частостью. Частость или структура, показывает долю совокупности данной классификационной группы.

Частость - отношение частоты к общему количеству исследуемых элементов, то есть объему совокупности.

Частоту обозначим n или f , частость - p или j.

Пример дискретного ряда.

Успеваемость в группе студентов-экономистов из 15 человек по одному из предметов.