Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Московская академия им. С.Ю. Витте

Факультет «Экономика»

Контрольная работа

Работу выполнила:

студентка 1го курса,

дистанционной формы обучения

Висляева М.Н.

г. Москва

При выполнении контрольного задания Вы должны сделать вторичную перегруппировку для несложного примера (пример выбрать самостоятельно) и объяснить, как и при выполнении каких условий справедлив такой перерасчет. При использовании компьютерных программ и более сложного примера указать также эффект и особенности применения ИТ.

В письменном ответе на задание Вы должны:

1. Объяснить связь между формулой сложения дисперсий и корреляционным отношением, разъяснить его статистический смысл.

2. Выполнить сравнение вариации для двух различных распределений с различными средними, объяснить условия сопоставимости при различии средних.

3. Дать наиболее полное объяснение смысла предельной ошибки, связать с понятием репрезентативности выборки и ее необходимым объемом.

4. Объяснить соотношение оценивания неизвестных параметров по МНК и проверку значимости полученных результатов по критериям проверки статистических гипотез.

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.

В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения. Рассмотрим приемы вторичной группировки на примере.

Произвести укрупнение интервалов на основе данных таблицы 1:

Таблица 1

Число магазинов

Приведенная группировка недостаточно наглядна, потому что не показывает четкой и строгой закономерности в изменении товарооборота по группам.

Уплотним ряды распределения, образовав шесть групп. Новые группы образованы путем суммирования первоначальных групп (табл. 2).

Таблица 2

Группы магазинов по размеру товарооборота за IV квартал, тыс. руб.

Число магазинов

Товарооборот за IV квартал, тыс. руб.

Товарооборот в среднем на 1 магазин, тыс. руб.

Совершенно четко видно, чем крупнее магазины, тем выше уровень товарооборота.

1. По аналитической группировке можно измерить связь с помощью эмпирического корреляционного отношения. Этот, показатель обозначается греческой буквой з (эта). Он основан на правиле разложения дисперсии, согласно которому общая дисперсия s2 равна сумме внутригрупповой и межгрупповой дисперсий.

Дисперсия результативного признака внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов. Эта дисперсия называется остаточной. Она определяется по формуле:

где у ij - значение признака у для i-й единицы в j-й группе;

J - среднее значение признака в j-й группе;

n j - число единиц j-й группе;

j = 1, 2, 3, ..., т.

Внутригрупповые дисперсии, рассчитанные для отдельных групп, объединяются в средней величине внутригрупповой дисперсии:

Межгрупповая дисперсия относится на счет изучаемого фактора (и факторов, связанных с ним), поэтому эта дисперсия называется факторной. Она определяется по формуле

Правило сложения дисперсий может быть записано:

Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Соответственно оно рассчитывается как отношение факторной дисперсии к общей дисперсии результативного признака:

Этот показатель принимает значения в интервале : чем ближе к 1, тем теснее связь, и наоборот.

Таблица 3. Исходные данные

Таблица 4. Рабочая таблица

Средний товарооборот = ?X*f / f= 17370/51 = 340,58 тыс. руб.

Дисперсия равна:

G 2 =? f*(X-Xср) 2 / ? f = 38682,36/51 = 758,48

Среднее квадратическое отклонение:

Коэффициент вариации равен:

V = G / Xср = 27,54/758,48 = 0,081; 8,1%.

Коэффициент вариации меньше 33%, следовательно, совокупность однородна.

Таблица 5. Исходные данные

1) средние затраты времени на проезд к месту работы у рабочих = Х ср =? Xf / ?f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41,8 мин.

2) расчет дисперсии

Дисперсия равна:

G 2 =? f отклонение:

3) Коэффициент*(X-Xср) 2 / ? f = 43160,8/420 = 102,8

Среднее квадратическое вариации равен:

V = G / Xср = 10,14/41,8 = 0,24; 24%

Коэффициент вариации меньше 33%, следовательно, рассмотренная совокупность однородна и средняя для нее достаточно типична.

Выборочную совокупность можно сформировать по количественному признаку статистических величин, а также по альтернативному или атрибутивному. В первом случае обобщающей характеристикой выборки служит выборочная средняя величина, обозначаемая, а во втором -- выборочная доля величин, обозначаемая w. В генеральной совокупности соответственно: генеральная средняя и генеральная доля р.

Разности -- и W -- р называются ошибкой выборки, которая делится на ошибку регистрации и ошибку репрезентативности. Первая часть ошибки выборки возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая часть ошибки возникает из-за постоянного или спонтанного несоблюдения принципа случайности отбора. Ее трудно обнаружить и устранить, она гораздо больше первой и потому ей уделяется основное внимание.

Исключительно важную роль для обоснования и применения выборочного наблюдения играет закон больших чисел. Использование законы больших чисел состоит в том, что при определенных условиях и при достаточно большом объеме наблюдений сводные характеристики, полученные на основе выборочного наблюдения, будут мало отличаться от соответствующих характеристик генеральной доверенности. Основываясь на этом, можно, увеличивая объем выборочной совокупности, уменьшить пределы возможных ошибок репрезентативности, довести их до наименьших размеров. С другой стороны, зная пределы ошибок репрезентативности, можно определить необходимую численность выборочной совокупности.

Одной из наиболее важных и ответственных задач при организации и проведении выборочного наблюдения является установление необходимой численности выборочной совокупности, т.е. такой ее численности, которая обеспечивала бы получение данных, достаточно правильно отражающих изучаемые свойства генеральной совокупности.

При этом должно быть учтено: 1) с какой степенью точности следует получить предельную ошибку выборки; 2) какова должна быть вероятность того, что будет обеспечена обусловленная точность результатов выборочного наблюдения; 3)степень колеблемости изучаемых свойств в исследуемой генеральной совокупности.

Это значит, что необходимая численность выборки устанавливается в зависимости от размеров предельной ошибки выборки, от величины коэффициента доверия (t) и от размеров величины дисперсии.

Метод оценивания параметров линейной регрессии, минимизирующий сумму квадратов отклонений наблюдений зависимой переменной от искомой линейной функции, называется методом наименьших квадратов.

Суть метода заключается в том, что критерием качества рассматриваемого решения является сумма квадратов ошибок, которую стремятся свести к минимуму. Для применения этого метода требует провести как можно большее число измерений неизвестной случайной величины (чем больше - тем выше точность решения) и некоторое множество предполагаемых решений, из которого требуется выбрать наилучшее. Если множество решений параметризировано, то нужно найти оптимальное значение параметров.

МНК используется в математике, в частности - в теории вероятностей и математической статистике. Наибольшее применение этот метод имеет в задачах фильтрации, когда необходимо отделить полезный сигнал от наложенного на него шума. Его применяют и в математическом анализе для приближённого представления заданной функции более простыми функциями. Ещё одна из областей применения МНК - решение систем уравнений с количеством неизвестных меньшим, чем число уравнений.

Этапы проверки статистических гипотез:

Формулировка основной гипотезы H 0 и конкурирующей гипотезы H 1 . Гипотезы должны быть чётко формализованы в математических терминах.

Задание вероятности б, называемой уровнем значимости и отвечающей ошибкам первого рода, на котором в дальнейшем и будет сделан вывод о правдивости гипотезы.

Расчёт статистики ц критерия такой, что:

её величина зависит от исходной выборки;

по её значению можно делать выводы об истинности гипотезы H 0 ;

сама статистика ц должна подчиняться какому-то известному закону распределения, т.к. сама ц является случайной в силу случайности.

Построение критической области. Из области значений ц выделяется подмножество таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство. Это множество и называется критической областью.

Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику ц и по попаданию (или непопаданию) в критическую область выносится решение об отвержении (или принятии) выдвинутой гипотезы H 0 .

дисперсия корреляционный вариация

Размещено на Allbest.ru

...

Подобные документы

    Таблица значений выборки дискретных случайных величин в упорядоченном виде. Таблица интервального статистического ряда относительных частот. Задание эмпирической функции распределений и построение ее графика. Полигон и распределение случайной величины.

    практическая работа , добавлен 26.07.2012

    Числовые характеристики для статистических распределений. Построение интервального вариационного ряда, многоугольника частостей, графика выборочной функции распределения и определения среднего значения выборки и выборочной дисперсии двумя способами.

    презентация , добавлен 01.11.2013

    Среднее значение показателя (среднее арифметическое). Показатели вариации - размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия, коэффициент вариации. Максимальное и минимальное значение статистического показателя.

    контрольная работа , добавлен 14.11.2008

    Понятие генеральной совокупности, математического ожидания и дисперсии. Обеспечение случайности и репрезентативности выборки в статистическом планировании. Дискретный и интервальный вариационный ряд, точечные оценки параметров распределения признака.

    реферат , добавлен 13.06.2011

    Сущность выборочного исследования. Способы отбора единиц в выборочную совокупность. Средняя и предельная ошибка для показателей средней величины и показателей доли. Определение необходимого объема выборки при заданной предельной ошибке среднего значения.

    презентация , добавлен 16.03.2014

    Формы, виды и способы статистического наблюдения. Виды группировок, их интервал и частота. Структура ряда динамики. Абсолютные и относительные статистические величины. Представление выборки в виде статистического ряда. Точечное и интервальное оценивание.

    курс лекций , добавлен 29.11.2013

    Построение интервальных вариационных рядов по показателям. Вычисление средней арифметической, моды и медианы, относительных и абсолютных показателей вариации. Определение количественных характеристик распределений, построение эмпирической функции.

    курсовая работа , добавлен 11.01.2012

    Диаграмма рассеивания как точки на плоскости, координаты которых соответствуют значениям случайных величин X и Y, порядок ее построения и назначение. Нахождение коэффициентов и построение графика линейного приближения, графика квадратичного приближения.

    курсовая работа , добавлен 03.05.2011

    Упорядочение исходной выборки наработок до отказа. Проверка статистической гипотезы о соответствии экспоненциальному распределению и распределению Вейбулла. Оценивание параметров распределений и показателей безотказности, его главные методы и приемы.

    курсовая работа , добавлен 22.01.2012

    Понятие вариационного ряда, статистического распределения. Эмпирическая функция и основные характеристики математического ожидания выборочной дисперсии. Точечные и интервальные оценки распределений. Теория гипотез - аналог теории доверительных интервалов.

Под статистической группировкой понимается распределение единиц наблюдения по группам по одному или нескольким признакам. Эти признаки называются группировочными. В зависимости от задач исследования строят типологические, структурные и аналитические группировки.

Типологическая группировка представляет собой распределение единиц наблюдения качественно неоднородной совокупности по социально-экономическим типам, классам, качественно однородным группам. Например, распределение совокупности предприятий по формам собственности (табл. 3.1); отраслям экономики; размеру бизнеса - малые, средние и крупные предприятия (отнесение к ним идет сразу по нескольким критериям); банков - на государственные и коммерческие и т.д. Основная задача типологической группировки - идентификация и описание типов исследуемого явления. Число выделяемых групп определяется количеством типов, классов, однородных групп, т.д. самим характером явления.

Таблица 3.1. Распределение предприятий и организаций по формам собственности на 1 января 2006 г.
Форма собственности Число предприятий и организаций, тыс.
Государственная 160
Муниципальная 252
Собственность общественных и религиозных объединений (организаций) 252
Частная 3 838
Прочие формы собственности, включая смешанную российскую, иностранную, совместную российскую и иностранную 265
Всего 4 767

Источник: Россия в цифрах. 2006: Крат. стат. сб. / Росстат. М., 2006. С. 167.

При структурной группировке разделение единиц однородной совокупности на группы происходит с целью выявления ее структуры по одному из признаков. Например, распределение наемных работников по полу, возрасту; распределение предприятий по численности работающих и т.д. Примером структурной группировки являются данные табл. 3.2.

Таблица 3.2. Структура работников по стажу работы на предприятии
Стаж работы, лет Число работников Число работников в процентах к итогу
До 2 10 5
2-4 20 10
4-6 30 15
6-8 80 40
8 и более 60 30
Итого 200 100

Важную роль в статистическом анализе играют аналитические группировки. С их помощью определяют наличие связи между признаками и ее направление. При этом один из признаков является результативным, а другой - факторным. Результативный признак меняется под воздействием факторного признака.

При построении аналитической группировки в качестве группировочного признака всегда выбирают факторный признак. В каждой выделенной группе рассчитывают среднее значение результативного признака. Например, в табл. 3.3 компании сгруппированы по величине затрат на рекламу. В каждой группе определен средний размер товарооборота. Из таблицы видно, что чем больше внимания компании уделяют рекламе, тем значительнее результаты их деятельности, выражающиеся в объеме товарооборота.

Связь между признаками называется прямой , если с ростом значений факторного признака увеличиваются значения результативного признака. Связь является обратной, если увеличение значений факторного признака приводит к уменьшению значений результативного признака. В нашем примере рост затрат на рекламу вызвал увеличение объемов товарооборота, значит между этими признаками наблюдается прямая связь .

Наряду с группировками в статистическом анализе используются классификации. Классификация - это общепринятое, традиционно применяемое, часто официально установленное разбиение совокупности на группы, являющееся определенным стандартом, при котором единицам наблюдения предъявляются строгие требования относительно их соответствия той или иной группе. В основе классификаций лежит качественный признак. К наиболее известным относятся классификации отраслей экономики, административно-территориального деления, экономических регионов, видов экономической деятельности и др. Классификации не являются чем-то стабильным, в соответствии с экономическими и политическими изменениями меняются и они.

В зависимости от количества признаков, по которым проводится группировка, различают простые и сложные группировки. Если группировка проводится по одному признаку, то она называется простой (см. табл. 3.1, 3.2). Если единицы совокупности группируются сразу по двум или более признакам, то такая группировка называется сложной. При этом внутри групп, образованных по одному признаку, единицы совокупности подразделяются на подгруппы по другому признаку. Примером сложной группировки является группировка учащихся на потоке по двум признакам - полу и возрасту. Ее результаты могут быть представлены в виде таблицы (табл. 3.4).

Таблица 3.4. Распределение учащихся на потоке по полу и возрасту
Возраст, лет Пол Итого
мужчины женщины
До 14 10 8 18
15 8 9 17
16 12 13 25
17 и более 11 10 21
Итого 41 40 81

Вторичная группировка данных. На практике часто возникают ситуации, когда по имеющимся сгруппированным данным требуется построить новую группировку. При этом, как правило, массив первичных данных оказывается недоступным. Тогда прибегают к методам вторичной группировки данных.

Вторичной группировкой называется перегруппировка уже сгруппированных данных без обращения к массиву первичных данных. Для этой цели применяются два подхода: объединение первоначальных интервалов, если границы новых и старых групп совпадают, и долевая перегруппировка данных при несовпадении границ.

Метод объединения первоначальных интервалов продемонстрируем на следующем примере. Предположим, что исходные данные представляют собой ряд, приведенный в табл. 3.5.

Таблица 3.5. Распределение работников фирмы по размеру заработной платы
Номер интервала Заработная плата, руб. Численность работающих, чел.
1 2 000-3 000 16
2 3 000-4 000 40
3 4 000-5 000 65
4 5 000-6 000 58
5 6 000-7 000 44
6 7 000 и выше 17
Итого - 240

Перегруппируем данные и образуем новые интервалы: "2000-4000", "4000-6000", "6000 и выше". Поскольку границы новых и старых интервалов совпадают, легко видеть, что в первый новый интервал "2000-4000" попадут работники первого и второго интервалов исходной группировки (16 + 40 = 56 чел.), во второй новый интервал - работники третьего и четвертого интервалов исходной группировки (65 + 58 = 123 чел.), в третий новый интервал - работники двух последних интервалов (44 + 17 = 61 чел.). Результаты перегруппировки представлены в табл. 3.6.

Таблица 3.6. Распределение работников фирмы по размеру заработной платы (вторичная группировка)
Номер интервала Заработная плата, руб. Численность работающих, чел.
1 2 000-4 000 56
2 4 000-6 000 123
3 6 000 и выше 61
Итого - 240

Долевая перегруппировка базируется на принципе равномерности распределения единиц наблюдения внутри границ интервальных групп. В результате ее проведения рассчитывают, какая часть единиц наблюдения перейдет из старой интервальной группы в новую.

Вторичная группировка

Вторичная группировка - это образование новых групп на ос­нове ранее произведенной группировки. Применяют два способа об­разования новых групп на основе ранее произведенной группировки.

Первый способ состоит в укрупнении первоначальных интерва­лов. Это наиболее простой и распространенный способ.

Второй способ принято называть методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определœенная до­ля единиц совокупности. Рассмотрим два способа на примере.

Имеется группировка сотрудников двух управлений одного из московских банков по размеру месячной заработной платы (цифры условные).

Таблица 3.6

Кредитное управление Валютное управление
№ груп­пы Число работ­ников, чел. № группы Размер зарплаты, руб. в мес. Число работ­ников, чел.
2000 - 2500 2000 - 3000
2500 - 3000 3000 - 5000
3000 - 4000 5000 - 7000
4000 - 5000 7000 и более
5000 и более - -
Итого Итого

Приведенные данные не позволяют сравнить распределœение работников по размеру месячной заработной платы, так как величины интервалов различны, в связи с этим крайне важно привести эти ряды распределœения к сопоставимому виду.

Произведем вторичную группировку, образовав группы с новыми укрупненными интервалами.

Таблица 3.7

При вторичной группировке методом долевой перегруппировки устанавливаем новые интервалы распределœения работников по размеру месячной заработной платы, при этом за каждым интервалов закрепляем определœенную долю единиц совокупности. В нашем примере одну из группировок (по кредитному управлению) оставляем без изменений. А по валютному управлению производим перегруппировку следующим образом. В первой группе с интервалом от 2000 до 3000 руб. частота равна 2. Применительно к группировке по кредитному управлению данный интервал крайне важно разбить на два равных интервала: от 2000 до 2500 руб. и от 2500 до 3000 руб., при этом исходная частота делится поровну. Следующий интервал от 3000 до 5000 руб. соответственно нужно разделить на два равных интервала: от 3000 до 4000 руб. и от 4000 до 5000 руб., при этом исходная частота делит­ся поровну (6:2 = 3). Последние две группы крайне важно объединить в одну с интервалом 5000 руб. и выше.

Таблица 3.8

№ группы Размер зарплаты, руб. в мес. Кредитное число управления работников Валютное число управления работников
чел. в % к ито­гу чел. в % к итогу
2000 - 2500 8,33 3,33
2500 - 3000 16,67 3,33
3000 - 4000 25,00 10,00
4000 - 5000 33,33 10,00
5000 и выше 16,67 73,34
Итого 100,00 100,00

Контрольные вопросы

(выберите правильный ответ)

1. Статистическая сводка включает в себя:

а) только подсчет итогов в данных;

б) группировку данных и подсчет итогов;

в) группировку данных, подсчет итогов и расчет обобщаю­щих показателœей.

2. Группировка, в которой изучается структура совокупности, принято называть:

а) типологической; б) структурной; в) аналитической.

3. Группировочный признак может быть:

а) количественный;

б) качественный;

в) и количественный, и качественный.

4. Величина интервала определяется:

а) верхней границей интервала;

б) нижней границей интервала;

в) разностью верхней и нижней границ.

5. Вариационный ряд распределœения строится:

а) по качественному признаку;

б) по количественному признаку.

6. Частоты - это:

а) абсолютные числа;

б) относительные числа.

7. Частости - это:

а) абсолютные числа;

б) относительные числа.

8. В дискретном вариационном ряду значения признака выражены:

а) в виде чисел;

б) в виде интервалов.

9. Интервальный вариационный ряд графически изображается в виде:

а) полигона распределœения;

б) гистограммы;

в) кумуляты.

10. Вторичная группировка осуществляется методом:

а) уменьшения интервалов;

б) укрупнения интервалов;

в) и уменьшения, и укрупнения интервалов;

г) долевой перегруппировки.

Наряду с первичным группировкой в??статистике находит широкое применение вторичное группировки. Вторичным группировкой называют образование новых групп на основе ранее проведенного группировки

Вторичное группировки используют для решения различных задач, важнейшими из которых являются: 1) образование на основе группам по количественным признакам качественно однородных групп (типов) 2) приведение двух (а или более) группам с различными интервалами к единому виду с целью сопоставимости и анализа, 3) образование более укрупненных групп, в которых яснее проявляется характер распределение.

Суть этого приема заключается в получении сопоставимых данных по различным группировках, для чего: численный состав группы (по проценту) фиксируется на одном уровне во всех группировках; по всем группировках уста овлюеться также равное число групп и одинаковое содержание групповых таблиц. Сравнению и сопоставлению подлежат не абсолютные показатели по группам, а относительные величины, процентное отношениея.

Различают два способа вторичного группировки: 1) путем преобразования интервалов первичного группировки (чаще простым укрупнением интервалов) и 2) путем закрепления за каждой группой определенной части единиц совокупности (частичное перегруппировки). При использовании этих способов вторичного группировки обычно предполагают, что распределение признака внутри интервалов будет равномернымм.

Применение вторичного группировки для приведения двух группам с различными интервалами к единому виду в целях сопоставимости проиллюстрируем на следующем примере. Для этого используем данные первичного декабря упування двух районов по численности работников животноводства (табл. 37.7).

. Таблица 37. Группировка хозяйств двух районов по численности работников животноводства

Район I

Район II

группы хозяйств по

группы хозяйств по

численности работников, чел

итоге

численности работников, чел

итоге

Непосредственно данные группам двух районов несопоставимы, так как хозяйства распределены по группам с различными интервалами: 20 чел в районе I и 30 чел в районе II. Число выделенных групп также неодинаковое

Для приведения двух группам в сопоставимый вид проведем вторичное группировки. С этой целью перегруппируют материалы в группы, единые для обоих районов: возьмем интервал 40 чел (табл. 38)

Поскольку есть возможность вторичное группировки хозяйств района I осуществить способом простого укрупнения интервалов (имеет место совпадение нижних и верхних интервалов в двух группировках), используем этот спос и б для решения поставленной задачи.

Поясним последовательность расчетов. В первую группу хозяйств с численностью работников до 160 чел войдут хозяйства I и II групп

. Таблица 38. Вторичное группировки хозяйств двух районов по численности работников животноводства

Удельный вес хозяйств этих групп в общем итоге составит 16% (12 апреля). Во вторую группу хозяйств с численностью работников от 160 до 200 чел войдут хозяйства III и IV групп их удельный вес га в общей сложности составит 45% (18 27). Аналогично выполняются расчеты при образовании остальных декабрягруп.

перегруппируют хозяйства района II. Поскольку укрупнение интервалов для хозяйств района II не подходит и задачи не решает используем способ частичного перегруппировки данных первичного группировками ня.

В первую, заново созданную группу хозяйств района II с численностью работников животноводства до 160 чел, полностью войдут хозяйства первичного группировки с таким же интервалом. Удельный вес хозяйств ств этой группы составляет 88%.

Во вторую группу хозяйств вторичного группировки с численностью работников от 160 до 200 чел полностью войдут хозяйства II группы (16%) и часть хозяйств III группы. Для определения части господ дарств, которую нужно взять с III группы, необходимо ее расчленить на подгруппы с численностью работников 190 - 200, 200 - 210, 210 - 220 чел. Показатели удельного веса хозяйств в этих подгруппах определяются я пропорционально делению величины интервала. Величина интервала, которую мы рассматриваем, составляет 30 чел и делится на три равные части. Для получения нужного интервала 160 - 200 чел до величины интервала II группы (160 - 190 чел) следует добавить одну треть величины интервала III группы (190 - 220 чел) и такую??же часть хозяйств этой группыієї групи.

Итак, во вторую, заново созданную группу хозяйств, войдут 16% хозяйств второй группы и одна треть III группы - 10% (1/3-30), что составит 26% от общей численности хозяйств района II

В III группу хозяйств вторичного группировки (200 - 240 чел) войдет часть хозяйств III группы (190 - 220 чел), оставшуюся - 20% (% -30) и две трети хозяйств IV группы (220 - 250 чел) - % (% -21), то есть 34% всей численности хозяйств района I II.

Аналогичные расчеты выполняются и при образовании остальных, заново созданных групп хозяйств: 240 - 280 и более 280 чел. Как бы в табл 37 наряду с данными об удельном весе хозяйств по группам были приведены и данные об их численности, то расчеты по заново созданных группах выполнялись бы в тех же соотношениях, что и по удельному весу хоств.

После вторичного группировки первичный материал становится сравнимым, поскольку для двух районов взяты одинаковые группы по численности работников. Из данных табл 38 видно, что распределение хозяйств по численности ю работников животноводства в двух районах существенно отличается: в районе I преобладают хозяйства с численностью работников животноводства до 200 чел (61% общей численности хозяйств), в районе II - хозяйства с численностью работников животноводства - более 200 чел (66% общей численности хозяйстврств).

  • Суть и виды статистических группировок.
  • Выполнение группировки по количественному признаку.
  • Ряды распределения, их виды и графическое изображение.

Суть и виды статистических группировок

В результате первой стадии статистических исследований (статистического наблюдения) получают статистическую информацию , представляющую собой большое количество первичных, разрозненных сведений об отдельных единицах объекта исследования (например, записи о каждом гражданине страны при переписи населения: пол, национальность, возраст, образование и др.).

Дальнейшая задача статистики заключается в этом, чтобы привести эти материалы в определенный порядок, систематизировать и на этой основе дать сводную характеристику всей совокупности фактов для того, чтобы изучить характерные черты и отличительные особенности изучаемого явления и выявить закономерности его развития. Это достигается на второй стадии статистического исследования, первой ступенью которой является статистическая сводка.

Статистическая сводка – это научно организованная обработка первичных данных в целях получения обобщающих характеристик изучаемого явления по ряду существенных для него признаков.

Если производится только подсчет общих итогов по изучаемой совокупности единиц наблюдения, то сводка называется простой. Например: чтобы узнать общую численность студентов высших учебных заведений Украины достаточно сложить количество студентов всех ВУЗов на определенную дату.
Статистическая сводка включает в себя такие составляющие элементы:

  • выбор группировочных признаков (например, после переписи население можно делить на группы по признакам: пол, возраст, национальность);
  • распределение данных на части (группы и подгруппы);
  • расчет итоговых групповых данных с помощью системы статистических показателей.
  • систематизация полученных результатов в виде статистических таблиц.

Объединение отдельных единиц статистической совокупности в группы осуществляется при помощи метода группировок.

Статистическая группировка – это процесс образования однородных групп по ряду существенных признаков. Осуществляется группировка либо путем деления совокупности на отдельные части, которые характеризуются внутренней однородностью и отличаются рядом признаков, либо путем объединения отдельных единиц в группы по типовым признакам (например, группировка промышленных предприятий по форме собственности, группировка населения по размеру среднедушевого дохода, группировка коммерческих банков по сумме актива баланса и т.д.).

Признаки, по которым производится распределение единиц изучаемой совокупности на группы, называются группировочными признаками или основанием группировки . Если группировка получена по количественному признаку, она называется количественной, по качественному – атрибутивной или качественной.
На группировку в статистическом анализе возлагаются следующие функции:

  • выделение социально-экономических типов явлений;
  • изучение структуры и структурных сдвигов;
  • анализ взаимосвязей между явлениями.

В соответствии с этими функциями различают типологические, структурные и аналитические (факторные) группировки.
Типологическая группировка – это распределение качественно разнородной совокупности на классы, социально-экономические однородные типы. К этому виду относятся группировки стран по социально-политическому устройству, предприятий – по форме собственности, населения – по месту проживания (городское и сельское).

Разделение однородной совокупности на группы с целью выявления ее внутренней структуры называется структурной группировкой. Она характеризует состав совокупности, объем (весомость) ее отдельных групп.
Таблица 1 – Группировка потребителей йогурта по возрасту

Анализ структурных группировок, взятых за ряд периодов или моментов времени, показывает изменение структуры изучаемых явлений, т.е. структурные сдвиги , что отражает закономерности их развития.

Аналитические группировки используются для исследования наличия зависимости между изучаемыми явлениями. Для этого следует данные сгруппировать по одному из признаков, вычислить в каждой группе среднее значение второго признака, а затем сопоставить изменения изучаемых признаков. Если с увеличением или уменьшением группировочного признака увеличиваются значения второго признака, то связь (прямая или обратная) между ними существует.
Таблица 2 – Группировка магазинов по численности работников (данные условные)


Численность работников, чел.

Количество магазинов

Средняя фактическая продолжительность рабочей недели, ч.

100 и более

Данные показывают, что между размером предприятия и занятостью его работников существует связь: чем больше по количеству работающих магазин, тем короче рабочая неделя.

Если группы, образованные по одному признаку, делятся затем на группы по второму и т.д. признакам, то такая группировка называется комбинированной . Например, распределив группы потребителей йогурта по полу, получим комбинированную группировку.
Таблица 3 – Группировка потребителей йогурта по возрасту и полу

Группы потребителей по возрасту, лет

Число потребителей, чел.

мужского пола

женского пола

Менее 20
20-30
30-40
40-50
50-60
Старше 60

10
40
30
10
6
4

4
17
12
6
3
1

6
23
18
4
3
3

Выполнение группировки по количественному признаку

При составлении структурных группировок на основе количественных признаков определяют количество групп и интервалы группировки .

Интервал – количественное значение, определяющее и отделяющее одну группу от другой, т.е. он очерчивает количественные границы групп.
Интервалы могут быть равные и неравные. Например: по численности работающих предприятия могут быть разбиты на группы: до 100, 100-200, 200-500, 500-1000, 1000 и более. Это объясняется тем, что изменение признака на 50-100 чел. имеет существенное значение для мелких предприятий, а для крупных – не имеет.
Для группировок с равными интервалами величина (длина, шаг) интервала определяется по формуле:

,
где ,– наибольшее и наименьшее значение признака;
к – число групп (интервалов), определяемое по формуле Стерджесса:

,

где N – число единиц совокупности.
Округление полученных в расчетах нецелых чисел производится в большую сторону.
Например: необходимо произвести группировку с равными интервалами 20 рабочих цеха по производительности их труда. Наибольшая производительность 180 деталей за смену, наименьшая – 60.
Количество групп:
Длина интервала: дет.
Нижняя граница 1-ой группы 60 деталей, верхняя 60+20=80 деталей. Вторая группа: нижняя граница 80, верхняя 80+20=100 и т.д. В результате получаем такой интервальный ряд (или такие группы рабочих), деталей:

1 группа: 60-80
2 группа: 80-100
3 группа: 100-120
4 группа: 120-140
5 группа: 140-160
6 группа: 160-180

В этом распределении имеется неопределенность, к какой группе отнести единицу совокупности, значение признака которой равно граничному значению интервала (рабочих с производительностью 80, 100, 200 и т. д. дет/см). Для устранения неопределенности используют принцип единообразия: левая, нижняя граница интервала включает в себя указанное значение, а верхняя – нет. Значит, рабочего, производящего 100 дет/см, относят к 3 группе.

Интервалы групп могут быть закрытыми , когда указаны верхняя и нижняя границы (как в примере), и открытыми , когда указана лишь одна из границ. Например, интервалы «менее 60» или «180 и выше» - открытые интервалы. Для расчета показателей статистической совокупности открытые интервалы необходимо «закрыть». Для этого используют величину интервала, соседнего с «открытым». В примере получим: 40-60 и 180-200.

Сказанное выше относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но довольно часто приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, группировки могут быть не сопоставимы из-за различного числа групп или неодинаковых границ интервалов. Для приведения группировок к сопоставимому виду используется метод вторичной группировки , который заключается в образовании новых групп на основе ранее осуществленной группировки. Эта перегруппировка возможна двумя способами: 1) объединением первоначальных интервалов (т.е. их укрупнением); 2) долевой перегруппировкой.
Рассмотрим пример, данные условные.

Таблица 3 – Группировка акционеров по размеру дивидендов на одну акцию.


1-й район

№ груп-пы

Количество акционеров, %

№ груп-пы

Группы акционеров по размеру диви-дендов, грн.

Количество акционеров, %

1
2
3
4
5

1 – 4
4 – 8
8–12
12–16
16–20

18
12
40
25
5

1
2
3
4

1– 6
6–12
12–20
20–30

10
20
40
30

Приведенные данные не позволяют сравнить распределение акционеров двух районов по размеру дивидендов из-за различного числа групп (5 и 4) и различной длины интервала. Взяв за основу группировку 2-го района (как более крупную), произведем вторичную группировку акционеров 1-го района.

Таблица 4 – Вторичная группировка акционеров по размеру дивидендов на 1 акцию


№ груп-пы

Группы акционеров по размеру дивидендов, %

Количество акционеров, %

1
2
3
4

1 – 6
6–12
12–20
20–30

10
20
40
30

24
46
30

18+0,5*12=24
0,5*12+40=46
25+5=30

Анализ сопоставимых данных вторичной группировки позволяет сделать вывод: акционеры второго района имеют более высокие дивиденды: (12 и выше грн. получают 40+30=70 % акционеров, а в первой – только 30 %).

Ряды распределения, их виды и графическое изображение

Статистический ряд распределения – это упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку (предыдущий пример – это ряд распределения). Он, являясь разновидностью структурной группировки, характеризует состав (или структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Ряды распределения, построенные по атрибутивному признаку, называются атрибутивными (распределение населения по полу, занятости, профессии и т.д.).
Ряды, построенные по количественному признаку, - вариационными (распределение населения по стажу работы, з/п, возрасту.).

Конструктивно вариационный ряд распределения представляет собой таблицу, в первом столбце которой расположены варианты или их интервалы, во второй – частоты или (и) частости (третий столбец) . Принято варианты обозначать, частоты - , частости - .
Варианты, т.е. числовые значения количественного признака в вариационном ряду распределения, могут быть положительными или отрицательными. Так, при группировке предприятий по результатам деятельности варианты положительные (прибыль) или отрицательные (убыток).

Частоты это числа, показывающие, как часто встречаются те или варианты в данной совокупности. Сумма всех частот называется объемом совокупности и показывает число единиц совокупности, обозначается N.

Частости это частоты, выраженные в виде относительных величин: долях единицы или в процентах, рассчитываются как отношение частоты к объему совокупности. Сумма частостей всегда равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.
Для анализа совокупности вариационный ряд дополняют такими элементами, как накопленная частота, накопленная частость и плотность распределения.

Накопленная частота (Sf)показывает число единиц совокупности, у которых значение варианты не больше данной, определяется суммированием частот всех предшествующих интервалов, включая данный:

, , и т.д.

Если вместо частот использовать частости, то аналогично получим накопленные частости (Sw):

, , и т.д.

Абсолютная плотность распределения – это частота, приходящаяся на единицу длины интервала, т. е. , а относительная плотность распределения – частость, приходящаяся на единицу длины интервала, т. е. . Плотность распределения используется в рядах с неравными интервалами для приведения частот и частостей к сопоставимому виду.
Вариационные ряды в зависимости от характера вариации делят на дискретные и интервальные.
Дискретные вариационные ряды строятся на основе дискретных (прерывных) признаков. Дискретные – это признаки, варианты которых имеют только целые значения и количество их невелико. Интервальные вариационные ряды основаны на непрерывных признаках (т.е. принимающих любые значения, в том числе и дробные) или дискретных, варьирующих в широком диапазоне.

Пример построения дискретного ряда распределения . Стаж работы в годах 10 рабочих бригады характеризуются следующими данными: 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.
Первым шагом в упорядочении первичного ряда является его ранжирование , т.е. расположение всех вариант в возрастающем или убывающем порядке.
Ранжированный ряд: 2, 3, 3, 4, 4, 4, 4, 5, 5, 5.

Таблица 5 – Дискретный вариационный ряд распределения рабочих по стажу работы


Стаж
работы (варианты хi)

Количество рабочих определенного стажа (частота fi)

Частости

Накопленные частоты

Накопленные частости

2
3
4
5

1
2
4
3

(1:10)*100=10
(2:10)*100=20
40
30

1
1+2=3
3+4=7
7+3=10

10
30
70
100

Пример построения интервального ряда . Имеются данные о среднемесячной з/п 30 работников, которая варьируется от 600 до 1200 грн. Построить интервальный ряд распределения.

Таблица 6 – Интервальный вариационный ряд распределения рабочих по размеру среднемесячной заработной платы

Группы рабочих по размеру з/п (интервалы вариант хi)

Количество рабочих (частоты fi)

Частости

Накопленные частоты

Накопленные частости

1) 600-700
2) 700-800
3) 800-900
4) 900-1000
5) 1000-1100
6) 1100-1200

3
6
8
9
3
1

26,7
30
10
3,3

3
3+6=9
9+8=17
26
29
30

10,0
30,0
56,7
86,7
96,7
100,0

Графически ряды распределения можно представить в виде гистограммы, кумуляты, полигона.
Интервальный вариационный ряд изображают в виде гистограммы . Для ее построения в прямоугольной системе координат по оси абсцисс откладывают отрезки, равные длине интервала. Затем на этих отрезках, как на основаниях, строят прямоугольники, высота которых пропорциональна частоте или частости. Для интервального ряда с неравными интервалами по оси ординат откладывают плотность распределения, так как в этом случае именно она дает представление о заполненности интервала. Площадь всей гистограммы численно равна сумме частот.
Пример построения гистограммы.

Если соединить середины каждого интервала отрезками прямой, то получим замкнутую фигуру в виде многоугольника, которая называется полигоном .
Полигон чаще используется для дискретных рядов. Для этого в прямоугольной системе координат строят точки с координатами (x1, f1), (x2, f2), …, (xN, fN), затем последовательно соединяют их отрезками, а из первой и последней точек опускают перпендикуляры на ось х. Полученный многоугольник является полигоном дискретного вариационного ряда.

Кумулята строится по накопленным частотам (или частостям), которые откладывают по оси у, а по оси х – варианты или верхние границы интервалов.