Ряд распределения в статистике - это простейшая группировка, представляющая собой упорядоченное распределение единиц совокупности на группы по изучаемому варьирующему признаку.

По характеру изучаемого признака ряды подразделяются на атрибутивные (когда варьирующий признак качественный, т.е. не имеет количественного выражения) и вариационные (если изучаемый признак измеряется количественно).

В каждом ряду распределения выделяют два основных элемента:

Варианты - конкретные значения признака;

Частоты - числа, показывающие, как часто встречаются данные варианты.

Если варианты представлены целыми значениями признака, то такие вариационные ряды распределения называются дискретными , а если варианты представлены числовыми интервалами, то такие ряды называются интервальными .

Ряды распределения дополняются частостями и накопленными (кумулятивными) частотами.

Частость - относительная частота, определяемая отношением числа единиц групп к общему объему совокупности.

Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше данного значения. Определяется последовательным прибавлением к частоте в первом интервале последующих частот ряда.

Величина интервала группировки интервального вариационного ряда определяется по формуле

где - максимальное значение признака, - минимальное значение признака, - число выделяемых групп.

При решении вопроса о том, сколько следует образовать групп, нужно принимать во внимание размах варьирования и численность единиц изучаемой совокупности. Чем больше размах варьирования признака, положенного в основу группировки, тем, как правило, больше может быть образовано групп.

Зависимость между числом групп и численностью единиц совокупности n можно выразить формулой американского ученого Стерджесса:

Эта зависимость может служить ориентировкой при определении числа групп в том случае, когда распределение единиц совокупности по данному признаку приближается к нормальному.

Если, например, требуется произвести группировку с равными интервалами по данным о стоимости основных фондов предприятий, максимальное значение которой составляет 7 млн. руб., минимальная - 1 млн. руб. и необходимо выделить при этом 4 группы, то величина интервала определяется следующим образом

В нашем примере группировка с равными интервалами примет такой вид

При такой записи следует помнить правило, что левая цифра включает в себя обозначенное значение, а правая не включает. Следовательно, предприятия с основными фондами 2,5 млн. руб. должно быть отнесено ко второй группе.

Проиллюстрируем построение ряда распределения на условном примере.

Пример 2.1 . Имеются следующие данные о производственном стаже работников малого предприятия, лет.

9, 3, 7, 2, 5, 3, 11, 6, 5, 4, 7

Необходимо построить ряд распределения работников по стажу, обработав 3 группы с равными интервалами.

Величина интервала группировки работников по стажу определяется по формуле

Тогда интервалы будут следующими:

2 - 5, 5 - 8, 8 - 11

Подсчитаем частоты и представим результаты в таблице, которую дополним частостями и кумулятивными частотами

Таблица 2.1. Ряд распределения работников по производственному стажу

Ряды распределения для наглядности и удобства анализа могут быть изображены графически. Основные виды графиков рядов распределения: полигон частот (Рис. 1), гистограмма (Рис. 2), кумулята (Рис. 3).

Для изображения построенного интервального ряда работников по производственному стажу в виде полигона частот следует превратить его в дискретный ряд. Для этого определить середины (центры) интервалов -

(3, 5; 6,5; 9,5). Из этих середин восстановить перпендикуляры равные частотам и соединить их вершины отрезками.

При построении гистограммы ряда распределения работников по стажу работы на оси абсцисс откладывают интервалы ряда, высота которых равна частотам отложенным по оси ординат. Над осью абсцисс строятся прямоугольники, площадь которых соответствует величинам произведений интервалов на их частоты.

Рис. 2.

При графическом изображении кумуляты накопленные частоты наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов, а именно 5, 8, 11. Перпендикуляры затем соединяют отрезками, в результате чего получают ломаную линию, которая начинается от нуля все время возрастает, до тех пор, пока не достигнет высоты, равной общей сумме частот.


Рис. 3.

Анализ ряда и графиков показывает, что распределение работников по стажу не является равномерным, чем больше стаж работников отличается от среднего стажа, тем реже такие работники встречаются.

Обобщение первичных данных в виде ряда распределения позволяет видеть вариацию и состав совокупности по изучаемому признаку, сравнивать между собой группы, изучать их динамику и устанавливать характер распределения единиц по тому или иному признаку.

Однако ряды распределения не дают всесторонней характеристики выделенных групп. Чтобы решить ряд конкретных задач, выявить особенности в развитии явлений, обнаружить тенденции, установить зависимости, необходимо произвести группировку статистических данных.

Как осуществляется конкретная группировка рассмотрим в следующем вопросе.

Особую форму группировки данных представляют так называемые статистические ряды, или числовые значения признака, расположенного в определенном порядке. В зависимости от того, какие признаки изучаются, статистические ряды делят на атрибутивные, вариационные, ряды динамики, регрессии, ряды ранжированных значений признаков и ряды накопленных частот. Наиболее часто в психологии используются вариационные ряды, ряды регрессии и ряды ранжированных значений признаков.

Вариационным рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной выборке. Например, психолог провел тестирование интеллекта по тесту Векслера у 25 школьников, и сырые баллы по второму субтесту оказались следующими: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 10, 9, 11. Как видим, некоторые цифры попадаются в данном ряду по несколько раз. Следовательно, учитывая число повторений, данные ряд можно представить в более удобной, компактной форме:

Это и есть вариационный ряд. Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами, или весами, вариант. Они обозначаются строчной буквой латинского алфавита.f i и имеют индекс “i”, соответствующий номеру переменной в вариационном ряду.

Процентное представление частот полезно в тех случаях, когда приходится сравнивать вариационные ряды, сильно различающиеся по объемам. Например, при тестировании школьной готовности детей города, поселка городского типа и села были обследованы выборки детей численностью 1000, 300 и 100 человека соответственно. Различие в объемах выборок очевидно. Поэтому сравнение результатов тестирования лучше проводить, используя проценты частот.

Приведенный выше ряд (3.1) можно представить по другому. Если элементы ряда расположить в возрастающем порядке, то получится так называемый ранжированный вариационный ряд:

Подобная форма представления (3.3) более предпочтительна, чем (3.1), поскольку лучше иллюстрирует закономерность варьирования признака.

Частоты, характеризующие ранжированный вариационный ряд, можно складывать, или накапливать. Накопленные частоты получаются последовательным суммированием значений частот от первой частоты до последней.

В качестве примера вновь обратимся к ряду 3.3. Преобразуем его в ряд 3.4 в котором введем дополнительную строчку и назовем ее «кумуляты частот»:

Рассмотрим подробно как получилась последняя строчка. В начале ряда частот стоит 1. В кумулятивном ряду на втором месте стоит 2 - это сумма первой и второй частоты, т.е. 1 + 1, на третьем месте стоит 4 это сумма второй (уже накопленной частоты) и третьей частоты, т.е. 2 + 2, на четвертом 8 = 4 + 4 и т.д.


Размах (иногда эту величину называют разбросом) выборки обозначается буквой R. Это самый простой показатель, который можно получить для выборки - разность между максимальной и минимальной величинами данного конкретного вариационного ряда, т.е.

Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот.

Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный. Например, даны две выборки:

При равенстве средних и разбросов для этих двух выборочных рядов характер их варьирования различен. Для того чтобы более четко представлять характер варьирования выборок, следует обратиться к их распределениям.

Таблицы и графики распределения частот

Как правило, анализ данных начинается с изучения того, как часто встречаются те или иные значения интересующего исследователя признака (переменной) в имеющемся множестве наблюдений. Для этого строятся таблицы и графики распределения частот. Нередко они являются основой для получения ценных содержательных выводов исследования.

Если признак принимает всего лишь несколько возможных значений (до 10-15), то таблица распределения частот показывает частоту встречаемости каждого значения признака. Если указывается, сколько раз встречается каждое значение признака, то это - таблица абсолютных частот распределения, если указывается доля наблюдений, приходящихся на то или иное значение признака, то говорят об относительных частотах распределения.

Во многих случаях признак может принимать множество различных значений, например, если мы измеряем время решения тестовой задачи. В этом случае о распределении признака позволяет судить таблица сгруппированных частот, в которых частоты группируются по разрядам или интервалам значений признака.

Еще одной разновидностью таблиц распределения являются таблицы распределения накопленных частот. Они показывают, как накапливаются частоты по мере возрастания значений признака. Напротив каждого значения (интервала) указывается сумма частот встречаемости всех тех наблюдений, величина признака у которых не превышает данного значения (меньше верхней границы данного интервала). Накопленные частоты содержатся в правых столбцах табл. 3.2 и 3.3.

Для более наглядного представления строится график распределения частот или график накопленных частот - гистограмма или сглаженная кривая распределения.

Гистограмма распределения частот - это столбиковая диаграмма, каждый столбец которой опирается на конкретное значение признака или разрядный интервал (для сгруппированных частот). Высота столбика пропорциональна частоте встречаемости соответствующего значения. На рис. 3.1 изображена гистограмма распределения частот для примера из табл. 3.2.

Гистограмма накошенных частот отличается от гистограммы распределения тем, что высота каждого столбика пропорциональна частоте, накопленной к данному значению (интервалу). На рис. 3.2 изображена гистограмма накопленных частот для данных табл. 3.2.

Построение полигона распределения частот напоминает построение гистограммы. В гистограмме вершина каждого столбца, соответствующая частоте встречаемости данного значения (интервала) признака, - отрезок прямой. А для полигона отмечается точка, соответствующая середине этого отрезка. Далее все точки соединяются ломаной линией (рис. 3.3). Вместо гистограммы или полигона часто изображают сглаженную кривую распределения частот. На рис. 3.4 изображена гистограмма распределения для примера из табл. 3.3 (столбики) и сглаженная кривая того же распределения частот.

Таблицы и графики распределения частот дают важную предварительную информацию о форме распределения признака: о том, какие значения встречаются реже, а какие чаще, насколько выражена изменчивость признака. Обычно выделяют следующие типичные формы распределения. Равномерное распределение – когда все значения встречаются одинаково (или почти одинаково) часто. Симметричное распределение - когда одинаково часто встречаются крайние значения. Нормальное распределение - симметричное распределение, у которого крайние значения встречаются редко и частота постепенно повышается от крайних к серединным значениям признака. Асимметричные распределения - левосторонние (с преобладанием частот малых значений), правосторонние (с преобладанием частот больших значений).

Уже сами по себе таблицы и графики распределения признака позволяют делать некоторые содержательные выводы при сравнении групп испытуемых между собой. Сравнивая распределения, мы можем не только судить о том, какие значения встречаются чаще в той или иной группе, но и сравнивать группы по степени выраженности индивидуальных различий - изменчивости по данному признаку.

Таблицы и графики накопленных частот позволяют быстро получить дополнительную информацию о том, сколько испытуемых (или какая их доля) имеют выраженность признака не выше определенного значения.

Раздел 4. Описательные статистики
(Статистическое распределение и его числовые характеристики)

Переменная может принимать много значений. На начальном этапе обработки данных вместо того, чтобы рассматривать все значения переменной, рекомендуется проанализировать т. к. описательные статистики. Они дают общее представление о значениях или разбросе значений, которые принимает переменная.

К первичным описательным статистикам (Descriptive Statistics) обычно относят числовые характеристики распределения измеренного на выборке признака. Каждая такая характеристика отражает в одном числовом значении свойство распределения множества результатов измерения: с точки зрения их расположения на числовой оси либо с точки зрения их изменчивости. Основное назначение каждой из первичных описательных статистик - замена множества значений признака, измеренного на выборке, одним числом (например, средним значением как мерой центральной тенденции). Компактное описание группы при помощи первичных статистик позволяет интерпретировать результаты измерений, в частности, путем сравнения первичных статистик разных групп.

Описание изменений варьирующего признака осуществляется с помощью рядов распределения.

Статистический ряд распределения - это упорядоченное распределение единиц статистической совокупности на отдельные группы по определенному варьирующему признаку.

Статистические ряды, построенные по качественному признаку называют атрибутивными . Если в основе ряда распределения лежит количественный признак, то ряд является вариационным .

В свою очередь вариационные ряды делят на дискретные и интервальные. В основе дискретного ряда распределения лежит дискретный (прерывный) признак, принимающий конкретные числовые значения (число правонарушений, число обращений граждан за юридической помощью). Интервальный ряд распределения строится на основе непрерывного признака, который может принимать любые значения из заданного диапазона (возраст осужденного, срок лишения свободы и т.д.)

Любой статистический ряд распределения содержит два обязательных элемента – варианты ряда и частоты. Варианты (x i ) – отдельные значения признака, которые он принимает в ряду распределения. Частоты (f i ) – это числовые значения, показывающие сколько раз встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности.

Частоты, выраженные в относительных единицах (долях или процентах) называются частостями (w i ). Сумма частостей равна единице, если Частости выражены в долях единицы, или 100, если они выражаются в процентах. Использование частостей позволяет производить сравнение вариационных рядов с разным объемом совокупности. Частости определяются по следующей формуле:

Для построения дискретного ряда ранжируются все встречающиеся в ряду индивидуальные значения признака, а затем подсчитываются частоты повторений каждого значения. Оформляется ряд распределения в идее таблицы, состоящей из двух строк и столбцов, в одной из которых приводятся значения вариантов ряда x i , во второй – значения частот f i .

Рассмотрим пример построения дискретного вариационного ряда.

Пример 3.1 . По данным УМВД зарегистрировано преступлений, совершенных в городе N несовершеннолетними в возрасте.

17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.

Построить дискретный ряд распределения.

Решение .

Сначала необходимо проранжировать данные о возрасте несовершеннолетних, т.е. записать их в порядке возрастания.

13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17



Таблица 3.1

Таким образом, частоты отображают количество человек данного возраста, например, 5 человек имеют возраст 13 лет, 8 человек – 14 лет, и т.д.

Построение интервальных рядов распределения осуществляют аналогично выполнению равноинтервальной группировки по количественному признаку, то есть вначале определяют оптимальное число групп, на которые будет разбита совокупность, устанавливаются границы интервалов по группам и подсчитываются частоты.

Проиллюстрируем построение интервального ряда распределения на следующем примере.

Пример 3.2 .

Построить интервальный ряд по следующей статистической совокупности – заработной плате юриста в конторе, тыс. руб.:

16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0 21,5 26,0 27,4

Решение.

Примем оптимальное количество групп равноинтервальной группировки для данной статистической совокупности, равное 4 (у нас 16 вариантов). Следовательно, численность каждой группы равна:

а величина каждого интервала будет равна:

Границы интервалов определяем по формулам:

,

где - соответственно нижняя и верхняя границы i-го интервала.

Опуская промежуточные вычисления границ интервалов, заносим их значения (варианты) и количество юристов (частоты), имеющих з/п в пределах каждого интервала, в таблицу 3.2, которая и иллюстрирует полученный интервальный ряд.

Таблица 3.2

Анализ статистических рядов распределения может производиться с использованием графического метода. Графическое представление рядов распределения позволяет наглядно проиллюстрировать закономерности распределения исследуемой совокупности путем ее изображения в виде полигона, гистограммы и кумуляты. Остановимся на каждом из перечисленных графиков.

Полигон – ломаная, отрезки которой соединяют точки с координатами (x i ;f i ). Обычно полигон используют для изображения дискретных рядов распределения. Для его построения на оси абсцисс откладывают ранжированные индивидуальные значения признака x i , на оси ординат – соответствующие этим значениям частоты. В результате, соединив отрезками точки, соответствующие данным, отмеченным по осям абсцисс и ординат, получают ломаную, называемую полигоном. Приведем пример построения полигона частот.

Для иллюстрации построения полигона возьмем результат решения примера 3.1 на построение дискретного ряда – рисунок 1. По оси абсцисс отложен возраст осужденных, по оси ординат – количество несовершеннолетних осужденных, имеющих данный возраст. Анализируя данный полигон, можно сказать, что наибольшее количество осужденных – 14 человек, имеют возраст 15 лет.

Рисунок 3.1 – Полигон частот дискретного ряда.

Полигон можно построить и для интервального ряда, в этом случае по оси абсцисс откладывают середины интервалов, а по оси ординат – соответствующие им частоты.

Гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат интервалы значения признака, а высоты равны соответствующим частотам. Гистограмма применяется только для изображения интервальных рядов распределения. Если интервалы являются неравными, то для построения гистограммы на оси ординат откладывают не частоты, а отношение частоты к ширине соответствующего интервала. Гистограмму можно преобразовать в полигон распределения, если середины ее столбиков соединить между собой отрезками.

Для иллюстрации построения гистограммы возьмем результаты построения интервального ряда из примера 3.2– рисунок 3.2.

Рисунок 3.2 – Гистограмма распределения заработной платы юристов.

Для графического изображения вариационных рядов также используют кумуляту. Кумулята – кривая, изображающая ряд накопленных частот и соединяющая точки с координатами (x i ;f i нак ). Накопленные частоты вычисляются последовательным суммированием всех частот ряда распределения и показывают число единиц совокупности, имеющих значение признака не больше, чем указанное. Проиллюстрируем вычисление накопленных частот для вариационного интервального ряда, представленного в примере 3.2 – таблица 3.3.

Таблица 3.3

Для построения кумуляты дискретного ряда распределения по оси абсцисс откладывают ранжированные индивидуальные значения признака, а по оси ординат – соответствующие им накопленные частоты. При построении кумулятивной кривой интервального ряда первая точка будет иметь абсциссу, равную нижней границе первого интервала, а ординату, равную 0. Все последующие точки должны соответствовать верхним граница интервалов. Построим кумуляту, используя данные таблицы 3.3 – рисунок 3.3.

Рисунок 3.3 – Кумулятивная кривая распределения заработной платы юристов.

Контрольные вопросы

1. Понятие статистического ряда распределения, его основные элементы.

2. Виды статистических рядов распределения. Их краткая характеристика.

3. Дискретные и интервальные ряды распределения.

4. Методика построения дискретных рядов распределения.

5. Методика построения интервальных рядов распределения.

6. Графическое изображение дискретных рядов распределения.

7. Графическое изображение интервальных рядов распределения.

Задачи

Задача 1 . Имеются следующие данные об успеваемости 25 студен­тов группы по ТГП в сессию: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3, 3, 5, 4, 2, 3, 3. Постройте дискретный вариационный ряд распределения студентов по баллам оценок, получен­ных в сессию. Для полученного ряда рассчитайте Частости, накопленные Частости, накопленные частоты. Сделайте выводы.

Задача 2 . В колонии содержатся 1000 осужденных, их распределение по возрасту представлено в таблице:

Изобразите данный ряд графически. Сделайте выводы.

Задача 3 . Имеются следующие данные о сроках лишения свободы заключенных:

5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.

Постройте интервальный ряд распределения заключенных по срокам лишения свободы. Сделайте выводы.

Задача 4 . Имеются следующие данные о распределении осужденных в области за изучаемый период по возрастным группам:

Изобразите данный ряд графически, сделайте выводы.

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение статистической сводки включает следующие этапы :

  • выбор группировочного признака;
  • определение порядка формирования групп;
  • разработка системы статистических показателей для характеристики групп и объекта в целом;
  • разработка макетов статистических таблиц для представления результатов сводки.

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).

Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле :

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.

Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный вариационный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.

Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от - до»), то для этого признака нужно строить интервальный вариационный ряд . Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.

Примеры решения задач по теме «Статистическая сводка и группировка»

Задача 1 . Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.

Построить ранжированный и дискретный вариационные ряды распределения, обозначив элементы ряда.

Решение

Данная совокупность представляет собой множество вариантов количества получаемых студентами книг. Подсчитаем число таких вариантов и упорядочим в виде вариационного ранжированного и вариационного дискретного рядов распределения.

Задача 2 . Имеются данные о стоимости основных фондов у 50 предприятий, тыс. руб.

Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).

Решение

Для решения выберем наибольшее и наименьшее значения стоимости основных фондов предприятий. Это 30,0 и 10,2 тыс. руб.

Найдем размер интервала: h = (30,0-10,2):5= 3,96 тыс. руб.

Тогда в первую группу будут входить предприятия, размер основных фондов которых составляет от 10,2 тыс. руб. до 10,2+3,96=14,16 тыс. руб. Таких предприятий будет 9. Во вторую группу войдут предприятия, размер основных фондов которых составит от 14,16 тыс. руб. до 14,16+3,96=18,12 тыс. руб. Таких предприятий будет 16. Аналогично найдем число предприятий, входящих в третью, четвертую и пятую группы.

Полученный ряд распределения поместим в таблицу.

Задача 3 . По ряду предприятий легкой промышленности получены следующие данные:

Произведите группировку предприятий по числу рабочих, образуя 6 групп с равными интервалами. Подсчитайте по каждой группе:

1. число предприятий
2. число рабочих
3. объем произведенной продукции за год
4. среднюю фактическую выработку одного рабочего
5. объем основных средств
6. средний размер основных средств одного предприятия
7. среднюю величину произведенной продукции одним предприятием

Результаты расчета оформите в таблицы. Сделайте выводы.

Решение

Для решения выберем наибольшее и наименьшее значения среднесписочного числа рабочих на предприятии. Это 43 и 256.

Найдем размер интервала: h = (256-43):6 = 35,5

Тогда в первую группу будут входить предприятия, среднесписочное число рабочих на которых составляет от 43 до 43+35,5=78,5 человек. Таких предприятий будет 5. Во вторую группу войдут предприятия, среднесписочное число рабочих на которых составит от 78,5 до 78,5+35,5=114 человек. Таких предприятий будет 12. Аналогично найдем число предприятий, входящих в третью, четвертую, пятую и шестую группы.

Полученный ряд распределения поместим в таблицу и вычислим необходимые показатели по каждой группе:

Вывод : Как видно из таблицы, вторая группа предприятий является самой многочисленной. В нее входят 12 предприятий. Самыми малочисленными являются пятая и шестая группы (по два предприятия). Это самые крупные предприятия (по числу рабочих).

Поскольку вторая группа самая многочисленная, объем произведенной продукции за год предприятиями этой группы и объем основных средств значительно выше других. Вместе с тем средняя фактическая выработка одного рабочего на предприятиях этой группы наибольшей не является. Здесь лидируют предприятия четвертой группы. На эту группу приходится и довольно большой объем основных средств.

В заключении отметим, что средний размер основных средств и средняя величина произведенной продукции одного предприятия прямо пропорциональны размерам предприятия (по числу рабочих).

Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта.

В зависимости от признака статистические ряды распределения делятся на следующие:

Атрибутивные (качественные);

Вариационные (количественные)

Дискретные;

Интервальные.

Вариационные ряды строятся на основе количественного группировочного признака. При этом вариационные ряды по способу построения бывают дискретными (прерывными) и интервальными (непрерывными). Дискретный ряд распределения - ряд, который основан на прерывной вариации признака, т.е. в котором значение признака выражено целым числом (тарифный разряд рабочих, число касс в магазине, число раскрытых преступлений и т.д.).

Интервальный ряд распределения - ряд, базирующийся на непрерывно изменяющемся значении признака, имеющего любые (в том числе и дробные) количественные выражения, т.е. значение признаков таких рядах задается в виде интервала.

Вариационные ряды состоят из двух элементов: вариант и частот.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения. Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями. Сумма частот составляет объем ряда распределения.

10. Статистические таблицы, как средство наглядного и компактного представления цифровой информации, должны быть статистически правильно оформлены.
Основными приемами, определяющими технику формирования статистических таблиц, являются следующие:
1. Таблица должна быть компактной и содержать только те данные, которые непосредственно отражают исследуемое явление в статике и динамике и необходимы для познания его сущности. Цифровой материал необходимо излагать таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением строк слева направо и сверху вниз;
2. Заголовок таблицы и названия граф и строк должны быть четкими, краткими, лаконичными, представлять собой законченное целое, органично вписывающееся в содержание текста. В названии таблицы должны найти отражение объект, признак, время и место совершения события.
3. Информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой. Существуют различные способы соединения слагаемых граф с их итогом:
строка «Итого» или «Всего» завершает статистическую таблицу;
итоговая строка располагается первой строкой таблицы и соединяется с совокупностью ее слагаемых словами «В том числе».
4. Если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то необходимо им присвоить объединяющий заголовок.
5. Графы и строки полезно нумеровать. Графы слева, заполненные названием строк, принято обозначать заглавными буквами алфавита (А), (В) и так далее, а все последующие графы - номерами в порядке возрастания.
6. Взаимосвязанные данные, характеризующие одну из сторон анализируемого явления целесообразно располагать в соседних друг с другом графах.
7. Графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям.
8. Числа целесообразнее, по возможности, округлять. Округление чисел в пределах одной и той же графы или строки следует проводить с одинаковой степенью точности.
Если все числа одной и той же графы или строки даны с одним десятичным знаком, а одно из чисел имеет точно два знака после запятой, то числа с одним знаком после запятой следует дополнять нулем, тем самым подчеркнув их одинаковую точность.
9. Отсутствие данных об анализируемом социально-экономическом явлении может быть обусловлено различными причинами и это по-разному отмечается:
а) если данная позиция (на пересечении соответствующих графы и строки) вообще не подлежит заполнению, то ставится знак «Х»;
б) если по какой-либо причине отсутствуют сведения, то ставится многоточие «...» или «нет свед.»;
в) если отсутствует явление, то клетка заполняется тире (-). Для отображения очень малых чисел используют обозначения (0,0) или (0,00.
10. В случае необходимости дополнительной информации - разъяснений к таблице, могут даваться примечания.
Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представления, обработки и обобщения статистической информации о состоянии и развитии анализируемых социально-экономических явлений.