Группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов.
Вторичная группировка, или перегруппировка сгруппированных данных применяется для лучшей характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа.
Вторичная группировка - операция по образованию новых групп на основе ранее осуществленной группировки.
Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаще укрупнение) первоначальных интервалов. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Проиллюстрируем методику вторичной группировки на следующем примере.
Пример:
Распределение сотрудников предприятия по уровню дохода

Произведем перегруппировку данных, образовав новые группы с интервалами до 5, 5-10, 10-20, 20-30, свыше 30 тыс. руб.
В первую новую группу войдет полностью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 5 тыс. руб., необходимо от интервала второй группы взять 1,0 тыс. руб. Величина интервала этой группы составляет 6,0 тыс. руб. Следовательно, необходимо взять от нее 1/6 (1,0:6,0) часть. Аналогичную же часть во вновь образуемую первую группу надо взять и от численности работающих, то есть
20 х1 = 3 чел. Тогда в первой группе будет работающих: 16+3 = 19 чел.
6
Вторую новую группу образуют работающие второй группы за вычетом отнесенных к первой, то есть 20-3 = 17 чел. Во вновь образованную третью группу войдут все сотрудники третьей группы и часть сотрудников четвертой. Для определения этой части от интервала 18-30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 2,0 тыс. руб.). Следовательно, необходимо взять часть интервала, равную . В этой группе 74 человека, значит надо взять 74х(1:6) = 12 чел. В новую третью группу войдут 44+12 = 56 чел. Во вновь образованную четвертую группу войдут 74-12 = 62 чел., оставшихся от прежней четвертой группы. Пятую вновь образованную группу составят работающие пятой и шестой прежних групп: 37+9 = 46 чел.
В результате получим следующие новые группы:

Еще по теме Сравнимость статистических группировок. Вторичная группировка:

  1. 1.3. Статистическое наблюдение и сводка. Группировка материалов статистического наблюдения.
  2. 10.2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ И УЧЕТ В ОРГАНИЗАЦИЯХ РАЗЛИЧНЫХ ОТРАСЛЕЙ. ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИЕ ВОЗМОЖНОСТИ СТАТИСТИЧЕСКОЙ ОТЧЕТНОСТИ

При анализе и сопоставлении нескольких группировок, например по нескольким цехам, предприятиям и т.д., может возникнуть ситуация когда исходные группировки несопоставимы из-за различного числа групп или разной величины используемых интервалов. Чтобы такие группировки привести в сопоставимый вид, т.е. либо к одному числу групп, либо к одной величине интервала, используется метод вторичной группировки. Метод вторичной группировки – это метод образования новых групп на основании имеющихся по заданным требованиям группировки. Для проведения вторичной группировки используются 2 способа: 1) объединение первоначальных групп, 2) долевая перегруппировка.

Приведение нескольких несопоставимых группировок в сопоставимой вид осуществляется в три этапа. На первом этапе осуществляется анализ исходных группировок на предмет выявления условий несопоставимости исходных группировок. На втором этапе выбирается способ приведения исходных группировок в сопоставимый вид. На третьем этапе осуществляется вторичная перегруппировка исходных группировок и анализ полученных результатов. При необходимости осуществляется повторная перегруппировка. Рассмотрим способы вторичной перегруппировки.

1 способ Статистическое наблюдение о распределении рабочих предприятия по стажу работы в 2000 году дало следующие результаты (табл.2.7).

Таблица 2.7

В 2002 году была проведено повторное статистическое наблюдение, которое дало следующие результаты (табл.2.8). Оценить изменения в распределении рабочих по стажу за 2 года непосредственно по данным обеих таблиц невозможно. Анализ обеих таблиц показывает, что они несовместны из-за разного числа групп и разной величины интервала.

Таблица 2.8

Чтобы привести данные обеих таблиц к сопоставимому виду можно в таблице 2.7 объединить как 1 и 2 группы, так и 3 и 4 группы. Это даст возможность оценить изменения в распределении рабочих по стажу, которые произошли на предприятии за два года. Результаты перегруппировки данных статистического наблюдения за 2000год (табл.2.7) приведены в таблице 2.9.

Таблица 2.9

Сравнивая данные за 2002 год (табл.2.8) с перегруппированными данными за 2000 год (табл.2.9) можно сделать вывод: за два года уменьшилось число рабочих со стажем до 6 лет, т.е. молодых, и увеличилось число рабочих с большим стажем.

2 способ Пусть статистическое наблюдение в 2002 году дало такие результаты (табл.2.10). Сравнивая данные за 2000 год (табл.2.9) и данные за 2002 год (табл. 2.7) можно сделать вывод о их несовместности из-за разного числа групп и разной величины интервала. Анализ показывает, что применение 1 способа приведения данных к сопоставимому виду невозможно. Поэтому используем 2 способ для перегруппировки данных за 2000 год (табл.2.7) таким образом, чтобы они соответствовали группировке данных за 2002 год (табл.2.10)

Таблица 2.10

Применение второго способа предполагает равномерное распределение частот внутри каждой группы. Это является непременным условием использования второго способа. Для перегруппировки данных за 2000 год (табл.2.7)сделаем следующие расчеты. Так в новую первую группу (1-4) (табл.2.10) войдут все данные старой первой группы (1-3) (табл.22.7) и данные о количестве рабочих, имеющих стаж 4 года из старой второй группы. Число рабочих, имеющих стаж 4 года, равен 3 (9/3=3, так как в старой второй группе было 9 рабочих, а интервал равен 3). Таким образом, новая первая группа (1-4) будет включать 18 рабочих (18=15+3)Вторая новая группа (5-8) будет включать 6 рабочих, имеющих стаж 5, 6 лет (из старой второй группы 6=9/3·2) и 18 рабочих, имеющих стаж 7, 8 лет (из старой третьей группы 18=27/3·2) Таким образом, новая вторая группа (5-8) будет включать 24 рабочих (24=6+18). В новую третью группу (9-12) войдут рабочие, имеющие стаж 9 лет (9=27/3) и все 9 рабочих из старой четвертой группы (10-12). Таким образом, в новой третьей группе (9-12) будет 18 рабочих (18=9+9). Перегруппированные данные за 2000год и данные за 2002 год сведем в одну таблицу(2.11), что позволит осуществить сравнительный анализ.

Таблица 2.11

Анализ распределения рабочих предприятия по стажу (табл.2.11) показывает, что в 2002 году число рабочих с большим стажем (от 9 до 12 лет) увеличилось, а с меньшим стажем (от 1 до 8 лет) – уменьшилось. Таким образом, перегруппировка данных позволила привести данные в сопоставимый вид, провести анализ и сделать необходимые выводы.

Контрольные вопросы и задания

1.Что такое статистическое наблюдение? Какие условия должны быть реализованы при проведении статистического наблюдения (смотрите определение)?

2. По каким признакам можно классифицировать статистические наблюдения? Приведите примеры статистического наблюдения.

3. Какие ошибки возникают при проведении статистических наблюдений и какие методы контроля могут быть использованы?

4. Определите в каком примере дана простая, а в каком сложная сводка. Пример 1. В понедельник в ткацком цехе работало 200 работниц. Пример 2. В понедельник в ткацком цехе на участке №1 работало 40 работниц, на участке №2 – 60 работниц, а всего работало 100 работниц.

5. Какие группировки используются при обработке статистической информации? Чем они разнятся между собой?

6. В отделе главного технолога работает 15 человек, а в отделе маркетинга и сбыта 10 человек. В каком случае коллективы отделов являются однородными совокупностями, а в каком случае –неоднородными совокупностями.

7. Ежедневная реализация ткани артикула А в магазине Ткани в октябре месяце характеризовалась следующими данными (в метрах): 4, 11, 8, 14, 10, 19, 12, 11, 3, 6, 21, 9, 9, 5, 10, 13, 15, 7, 10, 13, 16, 12, 8, 11, 14, 15, 17. Осуществить группировку данных, используя равные интервалы.

8. Перегруппировать результаты группировки данных из пункта 7 в следующие группы: (3-9), (9-15), 15-21).

Тема № 3 СТАТИСТИЧЕСКИЕ РЯДЫ РАСПРЕДЕЛЕНИЯ, ТАБЛИЦЫ, ГРАФИКА

3.1 Статистические ряды распределения – понятие, виды, формы представления

Одной из форм представления данных статистического наблюдения является статистический ряд распределения. Статистический ряд распределения – это упорядоченное расположение единиц совокупности на группы по группировочному признаку. С помощью статистических рядов распределения возможно изучение структуры и границ изменения совокупности, оценка однородности и определение закономерности развития единицсовокупности. По виду статистические ряды распределения подразделяются на атрибутивные, вариационные и временные ряды.

Атрибутивные и вариационные ряды состоят из двух элементов: варианты и частоты (частости или плотности). Варианта () – это конкретное значение признака, которое он принимает в ряду распределения. Частота () – это абсолютное число, показывающее, сколько раз (как часто) встречается в совокупности то или иное значение признака (варианта) или сколько единиц совокупности обладают тем или иным значением признака (вариантой). Частость () – это относительная величина, определяющая долю отдельных вариант в общем объеме совокупности (). Частость может быть выражена либо в долях, в этом случае объем совокупности равен единице (), либо в процентах, этом случае объем совокупности равен 100% (). В целом частость рассчитывается следующим образом

где - объем совокупности.

Плотность () - это относительная величина, показывающая, сколько единиц совокупности (в абсолютной или относительной форме) приходится на единицу длины интервала группы (). Плотность может быть абсолютной или относительной. Абсолюная плотность равна

Относительная плотность равна

При расчете относительной плотности используется частость, выраженная в долях.

Атрибутивный ряд – это ряд, построенный на основе качественного признака совокупности. Данные ряды строятся с помощью типологической группировки и могут быть выражены в виде таблицы. Например, распределение рабочих предприятия по тарифным разрядам (табл.3.1).

Таблица 3.1

В приведенном примере (табл.3.1) совокупностью являются все рабочие предприятия. Объем совокупности равен 250 человекам. Единицей совокупности является один рабочий. В качестве признака единицы совокупности выбран тарифный разряд. Признак имеет несколько конкретных значений – вариант (1 разряд, 2 разряд, 3 разряд, 4 разряд, 5 разряд). В таблице значения признака приведены в графе 2, значения частот в графе 3, значение частости в графе 4.

Вариационный ряд – это ряд, построенный на основе количественного признака совокупности. Данные ряды строятся, в основном, с помощью структурной группировки и могут быть выражены в виде таблицы. Вариационные ряды бывают двух типов: дискретные вариационный ряды и интервальные. Дискретный вариационный ряд – это ряд, в котором значения признака (варианты) представлены дискретными величинами . Интервальный вариационный ряд – это ряд, в котором значения признака выражены в виде интервалов . На основе данных о ежедневном обороте 34 индивидуальных предпринимателей, приведенных на стр. , построим вариационный интервальный ряд (табл.3.2)

Таблица 3.2

В графе 3 приведена частота – количество предпринимателей, однодневный оборот которых попадает в определенный интервал (гр.2). В графе 4 рассчитана частость в процентах по формуле 3.1. Так частость для первой группы (3,1 – 3,9) будет равна

Аналогичным образом рассчитывается частость и для других групп. В графе 5 приведена частость в долях. Она может быть получена либо путем расчета

либо путем преобразования процентов в доли . При расчетах данные в десятичной форме нужно показывать с точность до 3 знаков после запятой. Это повышает точность расчетов и получение соответствующих итоговых данных. Так сумма частостей в процентах должна быть равна 100%, а в долях – равна 1.

В графе 6 таблицы 3.2 приведены значения абсолютной плотности. Расчет выполнен по формуле 3.2. Так для первой группы абсолютная плотность будет равна

Если частота () взята из графы 3, то величина интервала () определена как разность между верхней границей (3,9) и нижней границей (3,1) интервала первой группы, т.о. . Аналогичным образом рассчитывается абсолютная плотность для других групп. После выполнения расчетов необходимо дать им экономическую интерпретацию. Так, например, абсолютная плотность первой группы говорит о том, что на каждую тысячу руб. оборота в первой группе приходится 5 предпринимателей.

В графе 7 таблицы 3.2 приведены значения относительной плотности. Расчет выполнен по формуле 3.3. Так для первой группы относительная плотность будет равна

Аналогичным образом рассчитываются относительная плотность и для других групп. Относительная плотность первой группы говорит о том, что доля предпринимателей, приходящих на каждую тысячу оборота в первой группе, равна 0,147.

В графе 2 табл.3.3 представлен оборот в виде интервалов, а в графе 3 представлен оборот в виде дискретных величин. Для первой группы дискретная величина рассчитана следующим образом

Аналогичным образом рассчитывается оборот в виде дискретной величины и для других групп.

Часто при анализе вариационных рядов возникает потребность в понимании изменения объема совокупности при изменении (в основном в порядке возрастания) значений признака. Для этого используются такие понятия как накопленные частоты или накопленные частости. Накопленные частоты ( ) – это сумма частот сначала ряда до определенного значения признака включительно. Накопленные частости – это сумма частостей от начала ряда до определенного значения признака включительно. Рассмотрим нахождение значений этих показателей по данным табл. 3.4 В графе 6 табл. 3.4 приведены накопленные частоты. В первой группе (гр.1) 4 предпринимателя (гр.4) имели оборот от 3,1 до 3,9 тыс. руб. (гр.2) или средний оборот 3,5 тыс. руб. (гр.3). Поскольку эта первая группа, постольку и накопленная частота т.е. количество предпринимателей будет равно 4 (гр.6). Во второй группе количество предпринимателей, имеющих оборот от 3,9 до 4,7 тыс. руб. или средний оборот в 4,3 тыс руб. равно 5 чел. Отсюда накопленная частота, т.е. количество предпринимателей, имеющих оборот от 3,1 до 4,7 тыс руб. или в среднем от и менее 4, 3 тыс. руб., будет равна 9=4+5. Для третьей группы накопленная частота будет равна 16=4+5+7 и т.д. Аналогичным образом рассчитывается и накопленная частость.

Группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов.

Вторичная группировка, или перегруппировка сгруппированных данных применяется для лучшей характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа.

Вторичная группировка - операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаще укрупнение) первоначальных интервалов. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Проиллюстрируем методику вторичной группировки на следующем примере.

Распределение сотрудников предприятия по уровню дохода

Произведем перегруппировку данных, образовав новые группы с интервалами до 5, 5-10,10-20,20-30, свыше 30 тыс. руб.

В первую новую группу войдет полностью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 5 тыс. руб., необходимо от интервала второй группы взять 1,0 тыс. руб. Величина интервала этой группы составляет 6,0 тыс. руб. Следовательно, необходимо взять от нее 1/6 (1,0:6,0) часть. Аналогичную же часть во вновь образуемую первую группу надо взять и от численности работающих, то есть 20 х 1/6 = 3 чел. Тогда в первой группе будет работающих: 16+3 = 19 чел.

Вторую новую группу образуют работающие второй группы за вычетом отнесенных к первой, то есть 20-3 = 17 чел. Во вновь образованную третью группу войдут все сотрудники третьей группы и часть сотрудников четвертой. Для определения этой части от интервала 18-30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 2,0 тыс. руб.). Следовательно, необходимо взять часть интервала, равную . В этой группе 74 человека, значит надо взять 74х(1:6) = 12 чел. В новую третью группу войдут 44+12 = 56 чел. Во вновь образованную четвертую группу войдут 74-12 = 62 чел., оставшихся от прежней четвертой группы. Пятую вновь образованную группу составят работающие пятой и шестой прежних групп: 37+9 = 46 чел.

Наряду с первичным группировкой в статистике находит широкое применение вторичное группировки. в Вторичным группировкой называют образование новых групп на основе ранее проведенной группировки.

Вторичное группировки используют для решения различных задач, важнейшими из которых являются: 1) образование на основе группировок по количественным признакам качественно однородных групп (типов); 2) приведение двух (или более) группировок с различными интервалами к единому виду с целью сопоставимости и анализа; 3) образование более укрупненных групп, в которых яснее проявляется характер распределения.

Суть этого приема заключается в получении сопоставимых данных по различным групуваннях, для чего: численный состав группы (с процентом) фиксируется на одном уровне у всех групуваннях; во всех групуваннях устанавливается также равное число групп и одинаковое содержание групповых таблиц. Сравнению и сопоставлению подлежат не абсолютные показатели по группам, а относительные величины, процентные отношения.

Различают два способа вторичной группировки: 1) путем преобразования интервалов первичного группирования (чаще простым укрупнением интервалов) и 2) путем закрепления за каждой группой определенной части единиц совокупности (частичная перегруппировка). При использовании этих способов вторичного группировки обычно предполагают, что распределение признака внутри интервалов будет равномерным.

Применение вторичного группировки для приведения двух группировок с различными интервалами к единому виду в целях сравнимости проиллюстрируем на следующем примере. Для этого используем данные первичного группирования двух районов по численности работников животноводства (табл. 3.7).

Таблица 3.7. Группировка хозяйств двух районов по численности работников животноводства

Район I

Район II

группы хозяйств по

группы хозяйств по

в итоге

численностью работников, чел.

в итоге

Непосредственно данные группировок двух районов несопоставимы, так как хозяйства распределены по группам с разными интервалами: 20 чел. в районе I и 30 чел. в районе II. Число выделенных групп также неодинаковое.

Для приведения двух группировок в сопоставимый вид проведем вторичную группировку. С этой целью перегрупуємо материалы в группы, единые для обоих районов: возьмем интервал 40 чел. (табл. 3.8).

Поскольку есть возможность вторичное группировка хозяйств района И осуществить способом простого укрупнения интервалов (имеет место совпадение нижних и верхних интервалов в двух групуваннях), используем этот способ для решения поставленной задачи.

Поясним последовательность расчетов. В первую группу хозяйств с численностью работников до 160 чел. войдут хозяйства I и II групп.

Таблица 3.8. Вторичное группировка хозяйств двух районов по численности работников животноводства

Удельный вес хозяйств этих групп в общем итоге составит 16% (4+12). Во вторую группу хозяйств с численностью работников от 160 до 200 чел. войдут хозяйства III и IV групп их удельный вес в общем итоге составит 45% (18+27). Аналогично выполняются расчеты при образовании остальных групп.

Перегрупуємо хозяйства района II. Поскольку укрупнение интервалов для хозяйств района II не подходит и задачи не решает используем способ частичного перегруппировки данных первичного группирования.

В первую, заново созданную группу хозяйств района II с численностью работников животноводства до 160 чел., полностью войдут хозяйства первичного группирования с таким же интервалом. Удельный вес хозяйств этой группы составляет 8%.

Во вторую группу хозяйств вторичного группировки с численностью работников от 160 до 200 чел. полностью войдут хозяйства II группы (16%) и часть хозяйств III группы. Для определения части хозяйств, которую нужно взять из III группы, необходимо ее расчленить на подгруппы с численностью работников 190 - 200, 200 - 210, 210 - 220 чел. Показатели удельного веса хозяйств в этих подгруппах определяются пропорционально делению величины интервала. Величина интервала, которую мы рассматриваем, составляет 30 чел. и делится на три равные части. Для получения нужного интервала 160 - 200 чел. до величины интервала II группы (160 - 190 чел.) следует добавить одну треть величины интервала III группы (190 - 220 чел.) и такую же часть хозяйств этой группы.

Итак, в другую, вновь созданную группу хозяйств, войдут 16% хозяйств второй группы и одна треть III группы - 10% (1/3-30), что составит 26% общей численности хозяйств района II.

В III группу хозяйств вторичного группировки (200 - 240 чел.) войдет часть хозяйств III группы (190 - 220 чел.), что осталась, - 20% (%-30) и две трети хозяйств IV группы (220 - 250 чел.) - 14% (%-21), то есть 34% всей численности хозяйств района II.

Аналогичные расчеты выполняются и при образовании остальных, заново созданных групп хозяйств: 240 - 280 и более 280 чел. Как бы в табл. 3.7 наряду с данными о удельный вес хозяйств по группам были приведены данные об их численности, то расчеты во вновь созданных группах выполнялись бы в тех же соотношениях, что и по удельным весом хозяйств.

После вторичного группировки первичный материал становится сопоставимым, поскольку для двух районов взяты одинаковые группы по численности работников. Из данных табл. 3.8 видно, что распределение хозяйств по численности работников животноводства в двух районах существенно отличается: в районе I преобладают хозяйства с численностью работников животноводства до 200 чел. (61% общей численности хозяйств), в районе II - хозяйства с численностью работников животноводства - свыше 200 чел. (66% общей численности хозяйств).

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.

В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения. Рассмотрим приемы вторичной группировки на примере.

Пример 1.

Произвести укрупнение интервалов на основе данных таблицы 2.7.:

Таблица 2.7.

Число магазинов

Приведенная группировка недостаточно наглядна, потому что не показывает четкой и строгой закономерности в изменении товарооборота по группам.

Уплотним ряды распределения, образовав шесть групп. Новые группы образованы путем суммирования первоначальных групп (табл. 2.8.).

Таблица 2.8.

Группы магазинов по размеру товарооборота за IV квартал, тыс.руб.

Число магазинов

Товарооборот за IV квартал, тыс.руб.

Товарооборот в среднем на 1 магазин, тыс.руб.

Совершенно четко видно, чем крупнее магазины, тем выше уровень товарооборота.

Пример 2.

Имеются следующие данные о распределении колхозов по числу дворов (табл. 2.9.).

Таблица 2.9.

Удельный вес колхозов группы в процентах к итогу

Группы колхозов по числу дворов

Эти данные не позволяют провести сравнение распределения колхозов в 2-х районах по числу дворов, так как в этих районах имеется различное число групп колхозов. Необходимо ряды распределения привести к сопоставимому виду.

За основу сравнения необходимо взять распределение колхозов 1 района. Следовательно, по второму району надо произвести вторичную группировку, чтобы образовать такое же число групп и с теми же интервалами, как и в первом районе. Получим следующие данные (табл.2.10.).

Таблица 2.10.

Группы колхозов по числу дворов

Удельный вес колхозов группы в % к итогу

21-7=14, 14+23=37

Для определения числа колхозов, которые надо взять из пятой группы во вновь образованную, условно примем, что это число колхозов должно быть пропорционально удельному весу отобранных дворов в группе.

Определяем удельный вес 50 дворов в пятой группе.

(50 * 18) / (250 - 150) = 9

Определяем удельный вес 50 дворов в шестой группе.

(50 * 21) / (400 - 250) = 7 и т.д.