Статистическое наблюдение заключается в сборе первич­ного статистического материала, в научно организованной регистрации всех существенных фактов, относящихся к рассмат­риваемому объекту. Это первый этап всякого статистического исследования.

Метод группировок дает возможность все собранные в результате массового статистического наблюдения факты подвергать систематизации и классификации. Это второй этап статистического исследования.

Метод обобщающих показателей позволяет харак­теризовать изучаемые явления и процессы при помощи статистических величин - абсолютных, относительных и средних. На этом этапе статистического исследования выявляются взаимосвязи и масштабы явлений, определяются законо­мерности их развития, даются прогнозные оценки.

На первом этапе статистического исследования форми­руются первичные статистические данные, или исходная статистическая информация, которая является фундаментом будущего статистического здания. Чтобы здание было прочным, добротной и качественной должна быть его основа. Если при сборе первичных статистических данных допущена ошибка или материал оказался недоброкачественным, это повлияет на правильность и достоверность как теоретических, так и практических выводов. Поэтому, статистическое наблюдение от начальной до завершающей стадии - получения итоговых материалов - должно быть тщательно продуманным и четко ооганизованным. Статистическое наблюдение дает исходный материал для обобщения, началом которого служит сводка. Если при статистическом наблюдении о каждой его единице получают сведения, характеризующие ее с многих сторон, то данные сводки характеризуют всю статистическую совокупность и отдельные ее части. На этой стадии совокупность делится по признакам различия и объединяется по признакам сходства, подсчитываются суммарные показатели по группам и в целом. С помощью метода группировок изучаемые явления делятся на важнейшие типы, характерные группы и подгруппы по существенным признакам. С помощью группировок ограничивают качественно однородные в существенном отношении совокупности, что является предпосылкой для определения и применения обобщающих показателей.

На заключительном этапе анализа с помощью обобщающих показателей рассчитываются относительные и средние величины, дается сводная оценка вариации признаков, характеризуется динамика явлений, применяются индексы, балансовые построения, рассчитываются показатели, характеризующие тесноту связей в изменении признаков. С целью наиболее рационального и наглядного изложения цифрового материала он представляется в виде таблиц и графиков.

Статистическое наблюдение - первый этап статистического исследования

Статистическое наблюдение - это первая стадия всякого статистического исследования, представляющая собой научно организованный по единой программе учет фактов, характе­ризующих явления и процессы общественной жизни, и сбор полученных на основе этого учета массовых данных.

Однако не всякий сбор сведений является статистическим наблюдением. О статистическом наблюдении можно говорить лишь тогда, когда изучаются статистические закономерности, т.е. такие, которые проявляются только в массовом процессе, в большом числе единиц какой-то совокупности. Поэтому статистическое наблюдение должно быть планомерным, массовым и систематическим.

Планомерность статистического наблюдения заключается в том, что оно готовится и проводится по разработанному плану, который включает вопросы методологии, организации, техники сбора информации, контроля за качеством собранного материала, его достоверности, оформления итоговых результатов. Массовый характер статистического наблюдения предполагает, что оно охватывает большое число случаев проявления данного процесса, достаточное для того, чтобы получить правдивые статистическиеданные, характеризующие не только отдельные единицы, но и всю совокупность в целом.

Наконец, систематичность статистического наблюдения определяется тем, что оно должно проводиться либо система­тически, либо непрерывно, либо регулярно. Изучение тенденций и закономерностей социально-экономических процессов, характеризующихся количественными и качественными изменениями, возможно лишь на этой основе. Из сказанного следует, что к статистическому наблюдению предъявляются следующие требования:

  • 1) полноты статистических данных (полноты охвата единиц изучаемой совокупности, сторон того или иного явления, а также полноты охвата во времени);
  • 2) достоверности и точности данных;
  • 3) их единообразия и сопоставимости.

Программно-методологические и организационные вопросы статистического наблюдения

Любое статистическое исследование необходимо начинать с точной формулировки его цели и конкретных задач, а тем самым и тех сведений, которые могут быть получены в процессе наблюдения. После этого определяются объект и единица наблюдения, разрабатывается программа, выбираются вид и способ наблюдения.

Результатом первого этапа статистического исследования -- статистического наблюдения -- являются сведения, характеризующие каждую единицу статистической совокупности. Однако, возможности отразить закономерности и тенденции динамики изучаемых явлений с помощью даже самой полной характеристики единичных фактов ограничены. Такие данные получают только в результате статистической сводки. Сводка - это упорядочение, систематизация и обобщение статистических данных, полученных при статистическом наблюдении. Только надлежащая обработка статистического материала позволяет выявить сущность социально-экономических явлений, характерные черты и существенные особенности отдельных типов, обнаружить закономерности и тенденции их развития. Различают сводку простую и групповую, или сводку в узком и широком понимании. Простая сводка -- это подсчет общих итогов в группах и подгруппах и оформление этого материала в таблицы. В результате простой сводки статистических данных можно определить количество предприятий, общую численность персонала, объем произведенной продукции в денежном выражении. Эти общие итоги носят в основном информативный характер. Они дают обобщенную характеристику совокупности в виде абсолютных величин.

Групповая сводка, или сводка в широком понимании, представляет собой сложный процесс по многосторонней обработке первичных статистических данных, т.е. данных, полученных в результате наблюдения. Он включает группировку статистических данных, разработку системы показателей для характеристики групп, подсчет групповых и общих итогов, расчет обобщающих показателей. Задача статистической сводки как второго этапа статистического исследования - получение обобщающих показателей для информационно-справочных и аналитических целей. Сводка массовых статистических данных осуществляется по заранее разработанным программе и плану. В процессе разработки программы определяются подлежащее и сказуемое сводки. Подлежащее -- это объект исследования, расчлененный на группы и подгруппы. Сказуемое -- показатели, которые характеризуют подлежащее сводки. Программа сводки определяется задачами статистического исследования.

Статистическая сводка выполняется по заранее составленному плану. В плане сводки решаются вопросы о способах проведения работы по обобщению информации -- вручную или механизированным способом, о последовательности отдельных операций сводки. Устанавливаются сроки выполнения каждого этапа и сводки в целом, а также способы изложения результатов сводки. Это могут быть ряды распределения, статистические таблицы и статистические графики.

2.1 Схема проведения статистического исследования

Системы статистического анализа данных – это современный эффективный инструмент статистического исследования. Широкие возможности для обработки статистических данных имеют специальные системы статистического анализа, а также универсальные средства – Excel, Matlab, Mathcad и др..

Но даже самый совершенный инструмент не может заменить исследователя, который должен сформулировать цель исследования, провести сбор данных, выбрать методы, подходы, модели и средства проведения обработки и анализа данных, а также интерпретировать полученные результаты.

На рисунке 2.1 представлена схема проведения статистического исследования.

Рис.2.1 - Принципиальная схема статистического исследования

Исходным пунктом статистического исследования является формулировка проблемы. При ее определении учитывается цель исследования, определяется, какая информация необходима и как она будет использоваться при принятии решения.

Само статистическое исследование начинается с подготовительного этапа. В ходе подготовительного этапа аналитики изучают техническое задание – документ, составляемый заказчиком исследования. В техническом задании должны быть четко сформулированы цели исследования:

    определен объект исследования;

    перечислены предположения и гипотезы, которые в ходе исследования должны быть подтверждены или опровергнуты;

    описано то, как будут использоваться результаты исследования;

    сроки, в которые исследование должно быть проведено и бюджет исследования.

На основе технического задания разрабатывается структура аналитического отчета - то, в каком виде должны быть представлены результаты исследования, а также программа статистического наблюдения . Программа представляет собой перечень признаков, подлежащих регистрации в процессе наблюдения (или вопросов на которые должны быть получены достоверные ответы по каждой обследуемой единице наблюдения). Содержание программы определяется как особенностями наблюдаемого объекта и целями исследования, так и методами, выбранными аналитиками для дальнейшей обработки собранной информации.

Основной этап статистического исследования включает сбор необходимых данных и их анализ.

Финальным этапом исследования является составление аналитического отчета и предоставление его заказчику.

На рис. 2.2 представлена схема статистического анализа данных.

Рис.2.2 – Основные этапы статистического анализа

2.2 Сбор статистической информации

Сбор материалов подразумевает анализ технического задания исследования, определение источников необходимой информации и (при необходимости) разработку анкет. При исследовании источников информации все требуемые данные разделяют на первичные (данные, которых нет в наличии и которые должны быть собраны непосредственно для данного исследования), и вторичные (собранные ранее для иных целей).

Сбор вторичных данных часто называют "кабинетным" или "библиотечным" исследованием.

Примеры сбора первичных данных: наблюдения за посетителями магазина, анкетирование пациентов больницы, обсуждение проблемы на совещании.

Вторичные данные делят на внутренние и внешние.

Примеры источников внутренних вторичных данных:

    информационная система организации (включающая в себя бухгалтерскую подсистему, подсистему управления продажами, CRM (CRM-система, сокращение от англ. Customer Relationship Management) - прикладное программное обеспечение для организаций, предназначенное для автоматизации стратегий взаимодействия с заказчиками) и другие);

    ранее проведенные исследования;

    письменные отчеты сотрудников.

Примеры источников внешних вторичных данных:

    отчеты органов статистики и других государственных учреждений;

    отчеты маркетинговых агентств, профессиональных ассоциаций и т.п.;

    электронные базы данных (адресные справочники, ГИС и т.п.);

    библиотеки;

    средства массовой информации.

Основными выходными данными на этапе сбора данных являются:

    планируемый объем выборки;

    структура выборки (наличие и размер квот);

    вид статистического наблюдения (сбор данных опрос, анкетирование, измерение, эксперимент, экспертиза, др.);

    информация о параметрах опроса (например, возможность факта фальсификации анкет);

    схема кодировки переменных в базе данных программы, выбранной для обработки;

    план-схема преобразования данных;

    план-схема используемых статистических процедур.

Этот же этап включает непосредственно процедуру анкетирования. Разумеется, анкеты разрабатываются только для получения первичной информации.

Полученные данные должны быть соответствующим образом отредактированы и подготовлены. Каждая анкета или форма наблюдения проверяется и, если нужно, корректируется. Каждому ответу присваиваются числовые или буквенные коды – производится кодировка информации. Подготовка данных включает в себя редактирование, расшифровку и проверку данных, их кодирование и необходимые преобразования.

2.3 Определение характеристик выборки

Как правило, данные, собранные в результате статистического наблюдения для проведения статистического анализа являются выборочной совокупностью. Последовательность преобразования данных в процесс статистического исследования можно схематично представить следующим образом (рис. 2.3)

Рис 2.3 Схема преобразования статистических данных

Анализируя выборку, можно делать выводы о генеральной совокупности, представленной выборкой.

Окончательное определение общих параметров выборки производят, когда все анкеты собраны. Оно включает:

    определение реального количества респондентов,

    определение структуры выборки,

    распределение по месту опроса,

    установление доверительного уровня статистической надежности выборки,

    расчет статистической ошибки и определение репрезентативности выборки.

Реальное количество респондентов может оказаться большим либо меньшим запланированного. Первый вариант лучше для анализа, но невыгоден заказчику исследования. Второй может отрицательно сказаться на качестве исследования, а, следовательно, невыгоден ни аналитикам, ни заказчикам.

Структура выборки может быть случайной или неслучайной (респонденты отбирались на основе заранее известного критерия, например методом квотирования). Случайные выборки априори являются репрезентативными. Неслучайные выборки могут быть намерено нерепрезентативными относительно генеральной совокупности, но давать важную информацию для исследований. В этом случае также следует внимательно отнестись к фильтрационным вопросам анкеты, которые предназначены специально для отсеивания неподходящих под требования респондентов.

Для определения точности оценивания , прежде всего, необходимо установить уровень доверительной вероятности (95% или 99%). Тогда максимальная статистическая ошибка выборки рассчитывается как

или
,

где - объем выборки,- вероятность наступления исследуемого события (попадание респондента в выборку),- вероятность обратного события (непопадания респондента в выборку),- коэффициент доверительной вероятности,
- дисперсия признака.

В таблице 2.4 приведены наиболее употребляемые значения доверительной вероятности и коэффициентов доверительной вероятности.

Таблица 2.4

2.5 Обработка данных на компьютере

Анализ данных с применением компьютера включает выполнение ряда необходимых шагов.

1. Определение структуры исходных данных.

2. Ввод данных в компьютер в соответствии с их структурой и требованиями программы. Редактирование и преобразование данных.

3. Задание метода обработки данных в соответствии с задачами исследования.

4. Получение результата обработки данных. Его редактирование и сохранение в нужном формате.

5. Интерпретация результата обработки.

Шаги 1 (подготовительный) и 5 (заключительный) не способна выполнить ни одна компьютерная программа - их исследователь делает сам. Шаги 2-4 выполняются исследователем с использованием программы, но именно исследователь определяет необходимые процедуры редактирования и преобразования данных, методы обработки данных, а также формат представления результатов обработки. Помощь компьютера (шаги 2–4) заключается, в конечном итоге, в переходе от длинной последовательности чисел к более компактной. На «вход» компьютера исследователь подает массив исходных данных, который недоступен осмыслению, но пригоден для компьютерной обработки (шаг 2). Затем исследователь дает программе команду на обработку данных в соответствии с поставленной задачей и структурой данных (шаг 3). На «выходе» он получает результат обработки (шаг 4) - тоже массив данных, только уже меньший, доступный осмыслению и содержательной интерпретации. При этом исчерпывающий анализ данных обычно требует многократной их обработки с применением разных методов.

2.6 Выбор стратегии анализа данных

Выбор стратегии анализа собранных данных основывается на знании теоретических и практических аспектов исследуемой предметной области, специфики и известных характеристик информации, свойств конкретных статистических методов, а также на опыте и взглядах исследователя.

Необходимо помнить, что анализ данных - это вовсе не конечная цель исследования. Его цель - получить информацию, которая поможет решить определенную проблему и принять адекватные управленческие решения. Выбор стратегии анализа должен начинаться с исследования итогов предыдущих этапов процесса: определение проблемы и разработка плана исследования. В качестве "черновика" используется предварительный план анализа данных, разработанный как один из элементов плана исследования. Затем, в ходе поступления на последующих стадиях процесса исследования дополнительной информации, может понадобиться внесение определенных изменений.

Статистические методы делятся на одно- и многомерные. Одномерные методы(univariatetechniques) используются тогда, когда все элементы выборки оцениваются одним показателем, либо если этих показателей несколько для каждого элемента, но каждая переменная анализируется при этом отдельно ото всех остальных.

Многомерные методы (multivariate techniques) прекрасно подходят для анализа данных, если для оценки каждого элемента выборки используется два или больше показателей и эти переменные анализируются одновременно. Такие методы применяются для определения зависимостей между явлениями.

Многомерные методы отличаются от одномерных прежде всего тем, что при их использовании центр внимания смещается с уровней (средних показателей) и распределений (дисперсий) явлений и сосредотачивается на степени взаимосвязи (корреляции или ковариации) между этими явлениями.

Одномерные методы можно классифицировать на основе того, какие данные анализируются: метрические или неметрические (рис. 3). Метрические данные (metric data) измеряются по интервальной шкале или относительной шкале. Неметрические данные (nonmetric data) оцениваются по номинальной или порядковой шкале

Кроме того, эти методы делят на классы на основе того, сколько выборок - одна, две или более - анализируется в ходе исследований.

Классификация одномерных статистических методов представлена на рис.2.4.

Рис. 2.4 Классификация одномерных статистических методов в зависимости от анализируемых данных

Число выборок определяется тем, как ведется работа с данными для конкретного анализа, а не тем, каким способом собирались данные. Например, данные по лицам мужского и женского пола можно получить в пределах одной выборки, но если их анализ нацелен на выявление разницы в восприятии, основанной на разнице полов, исследователю придется оперировать двумя разными выборками. Выборки считаются независимыми, если они экспериментально не связаны между собой. Измерения, проведенные в одной выборке, не оказывают влияния на значения переменных в другой. Для анализа данные, относящиеся к разным группам респондентов, например собранные от лиц женского и мужского пола, обычно обрабатываются как независимые выборки.

С другой стороны, если данные по двум выборкам относятся к одной и той же группе респондентов, выборки считаются объединенными в пары - зависимыми.

Если существует только одна выборка метрических данных, может использоваться z- и t-критерий. Если же независимых выборок две или больше, в первом случае можно воспользоваться z- и t-критерием для двух выборок, в во втором - методом однофакторного дисперсионного анализа. Для двух связанных выборок используется парный t-критерий. Если речь идет о неметрических данных по одной выборке, исследователь может воспользоваться критериями частотного распределения, хи-квадратом, критерием Колмогорова-Смирнова (K~S), критерием серий и биномиальным критерием. Для двух независимых выборок с неметрическими данными можно прибегнуть к следующим методам анализа: хи-квадрат, Манна-Уитни, медианы, К-С, однофакторным дисперсионным анализом Крускала-Уоллиса (ДА К-У). В отличие от этого, если существует две или больше взаимосвязанных выборок, следует воспользоваться критериями знаков, Мак-Немара и Уилкоксона.

Многомерные статистические методы нацелены на выявление существующих закономерностей: взаимозависимости переменных, взаимосвязи или последовательности событий, межобъектного сходства.

Достаточно условно можно выделить пять стандартных типов закономерностей, исследование которых представляет существенный интерес: ассоциация, последовательность, классификация, кластеризация и прогнозирование

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и "кока-колу", а при наличии скидки за такой комплект "колу" приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации выделяют различные однородные группы данных.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в виде временных рядов. Если удается построить найти закономерности, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем.

Многомерные статистические методы можно разделить на методы анализа взаимосвязи и классификационный анализ (рис. 2.5).

Рис.2.5 – Классификация многомерных статистических методов

Обработка собранных первичных данных, включающая их группировку, обобщение и оформление в таблицах, составляет второй этап статистического исследования, который называется сводкой .

Существует 3 основных формы представления обработанных статистических данных: текстовая, табличная и графическая .

На третьем этапе статистического исследования на основе итоговых данных сводки осуществляется научный анализ исследуемых явлений : рассчитываются различные обобщающие показатели в виде средних и относительных величин, выявляются определенные закономерности в распределениях, динамике показателей и т. п. На основе выявленных закономерностей делаются прогнозы на будущее.

Статистическое наблюдение – первая стадия статистического исследования. Почти всегда, в соответствии, конечно, с целями и задачами исследования начинают работу с учета фактов и сбора первичного материала. Первичный материал – это фундамент статистического исследования. От качества статистического наблюдения зависит успех всего исследования в целом. Оно должно быть организовано таким образом, чтобы в результате были получены объективные, точные данные об изучаемом явлении. Неполные, неточные данные, недостаточно хорошо характеризующие процесс, тем более искажающие его приводят к ошибкам. И анализ, проведенный на такой основе – будет ошибочным. Отсюда следует, что учет фактов и сбор первичного материала должны быть тщательно продуманы и организованы.

Необходимо еще раз отметить, что статистические наблюдения – всегда массовые. В силу вступает закон больших чисел - чем больше совокупность, тем объективнее будут полученные результаты.

В статистическом наблюдении можно выделить три этапа: 1. Подготовка наблюдения. Это формулировка программы наблюдения, определение показателей, сгруппированных в макеты конечных статистических таблиц.

Вопросы, составляющие содержание программы, должны вытекать из цели исследования или гипотезы, подтверждению которой предполагается посвятить исследование. Важным элементом являются макеты конечных статистических таблиц. Именно они являются проектом разработки результатов наблюдения и только при их наличии можно выявить все вопросы, которые необходимо включить в программу и избежать включения ненужной информации.

2. Непосредственный сбор материала . Это самая трудоемкая стадия исследования. Статистическая отчетность, как особая форма организации сбора данных, присуща только государственной статистике. Вся иная информация собирается посредством разнообразного статического инструментария. Необходимо указать на два основных требования к собранным данным: достоверность и сопоставимость. И крайне желаемое (в условиях рынка оно возрастает многократно) – своевременность.



3. Контроль материала перед его анализом. Как бы тщательно не был составлен инструментарий наблюдения, проведен инструктаж исполнителей, всегда материалы наблюдения нуждаются в контроле. Это объясняется массовым характером статистических работ и сложностью их содержания.

Объектом любого статистического исследования является совокупность единиц изучаемого явления. Объектом может быть население при переписи, предприятия, города, персонал фирмы и т.д. Словом, объект наблюдения – исследуемая статистическая совокупность. Очень важно определить и границы изучаемой совокупности, которые четко определяют изучаемую совокупность. Например, если ставится цель изучить деятельность малых предприятий области, то следует определить, к какой форме собственности оно относится (государственное, частное, совместное и т.д.), по какому критерию будут отбираться предприятия: отраслевые особенности, объем реализации, время с момента регистрации, состояние (действующее, бездействующее, во временном простое) и т.д. Совокупность должна быть однородной, иначе в процессе анализа возникнут дополнительные сложности и почти всегда неминуемы ошибки.

Наряду с определением объектом наблюдения и границ важно определить единицу совокупности и единицу наблюдения. Единица совокупности – индивидуальный составной элемент статистической совокупности. Единица наблюдения – это то явление, объект, признаки которого подлежат регистрации. Совокупность единиц наблюдения составляет объект наблюдения. Например, цель: исследовать влияние разных факторов на производительность труда рабочих на шахтах ОАО «Испат-Кармет». В этом случае – совокупность определена самой целью – шахтеры, работающие на шахтах «Испат-Кармет», единицей совокупности является шахтер, как носитель информации, а единицей наблюдения является шахта. Кратко: единица совокупности – то, что подвергается обследованию, единица наблюдения – источник сведений.
Для осуществления статистического наблюдения необходимо произвести сбор данных по заданному признаку, а именно: обозначить статистическую совокупность, которая состоит из материально существующих объектов, единицу и цель единовременного обследования объекта, составить программу статистического наблюдения.



На первом этапе формируется выборка собранных данных по обозначенным признакам, данные упорядочиваются по возрастанию. Затем следует составить таблицу распределения частот с последовательным заполнением соответствующих столбцов в таблице.

На втором этапе для обработки собранных первичных данных необходимо произвести группировку и обобщение отобранных элементов по заданному признаку, обозначить числовые характеристики выборки. Этот этап статистического исследования называется сводка . Сводка – научная обработка первичных данных в целях получения обобщенных характеристик изучаемого явления по ряду существенных для него признаков, т. е. первичные материалы сводятся вместе, образуют статистические совокупности, которые характеризуются итоговыми абсолютными обобщающими показателями. На стадии сводки мы переходим от характеристики отдельных варьирующих признаков единиц совокупности – к характеристике всей совокупности в целом или к характеристике их общего проявления в массе.

Следует найти размах по формуле:

R=x(max) – x(min);

моду M(0), которая показывает значение, встречающееся чаще других, медиану M(e), которая характеризует среднее значение (его не превышает половина членов ряда) соответствует варианте, стоящей в середине ранжированного вариационного ряда. Положение медианы определяется ее номером:Nме = (n+1) /2 , где n – число единиц в совокупности и среднее арифметическое значение для обозначенной группы, которая вычисляется по формуле:

Результаты работы могут быть представлены графически в виде гистограммы и полигона распределения частот.

Полученные данные отражают то общее, что присуще всем единицам исследуемой совокупности. В результате статистического наблюдения должна быть получена объективная, сопоставимая, полная информация, позволяющая на последующих этапах исследования обеспечить научно-обоснованные выводы о характере и закономерностях развития изучаемого явления.

Практическое задание

Провести статистическое исследование, выяснив сведенья о росте 2 5 случайным образом выбранных студентовТомского политехнического университета.

Составить таблицу распределения частот, найти размах, моду, медиану и среднее арифметическое значение роста (в см) для обозначенных юношей.

1. ЭТАПЫ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ

Процесс изучения социально-экономических явлений посредством системы статистических методов и количественных характеристик – системы показателей, называется статистическим исследованием.

Основными этапами проведения статистического исследования являются:

1) статистическое наблюдение;

2) сводка полученных данных;

3) статистический анализ.

В случае необходимости статистическое исследование может содержать дополнительный этап – статистический прогноз.

Статистическое наблюдение – научно организованный сбор данных о явлениях и процессах общественной жизни посредством регистрации по заранее разработанной программе наблюдения их существенных признаков. Данные наблюдения представляют собой первичную статистическую информацию о наблюдаемых объектах, которая является основой для получения их обобщающих характеристик. Наблюдение выступает как один из главных методов статистики и как одна из важнейших стадий статистического исследования.

Проведение статистического исследования невозможно без качественной информационной базы, получаемой в ходе статистического наблюдения. Поэтому, с момента изменения представлений о статистике как о науке описательной, разрабатываются особые правила проведения наблюдения и специальные требования к его результатам – статистическим данным. То есть, наблюдение является одним из основных методов статистики.

Наблюдение является первым этапом статистического исследования, от качества которого зависит достижение конечных задач исследования.

1.1. Наблюдение осуществляется по специально подготовленной программе.

Программа включает в себя перечень характеристик объекта исследования, данные о которых необходимо получить в результате наблюдения.

При подготовке наблюдения необходимо заранее определить:

1. Программу наблюдения, в которой:

а) определен объект наблюдения, т.е. то множество единиц явления, которое необходимо исследовать. Причем, необходимо отличать единицу наблюдения от отчетной единицы. Отчетная единица – единица предоставляющая статистические данные, может состоять из нескольких единиц совокупности, а может совпадать с единицей совокупности. Например, при обследовании населения единицей может быть член домохозяйства, а отчетной единицей – домохозяйство.

б) определены границы объекта наблюдения.

в) определены признаки объекта наблюдения, сведения о которых необходимо получить в результате наблюдения.

2. Время наблюдения объекта – время по состоянию на которое или за которое регистрируются сведения об изучаемом объекте.

3. Сроки проведения наблюдения. То есть, определяются период времени сбора данных и дата завершения наблюдения. Сроки наблюдения влияют на время окончания в целом статистического исследования и на своевременность его выводов.

4. Средства и ресурсы, необходимые для проведения наблюдения: количество квалифицированных специалистов; материальные ресурсы; средства обработки результатов наблюдения.

5. Требования к статистическим данным. Основными требованиями являются: а) достоверность, т.е. сведения об объекте исследования должны отражать реальное его состояние в момент наблюдения; б) сопоставимость данных, т.е. сведения, полученные в результате наблюдения, должны быть сравнимыми, что обеспечивается единой методикой сбора и анализа данных, по единицам измерения и т.д.

1.2. Выделяют несколько видов статистического наблюдения.

1. По охвату единиц совокупности:

а) сплошное;

б) несплошное (выборочное, монографическое, по методу основного массива)

2. По времени регистрации фактов: а) текущее (непрерывное); б) прерывное (периодическое, единовременное)

3. По способу сбора информации: а) непосредственное наблюдение; б) документальное наблюдение; в) опрос (анкетный, корреспондентский и др.)

Сводка – процесс приведения в систему полученных данных, их обработка и подсчет промежуточных и общих итогов, расчет взаимосвязанных величин аналитического характера.

Следующим этапом статистического исследования является подготовка полученных в ходе наблюдения сведений к анализу. Этот этап называется сводка.

Сводка включает в себя:

— систематизацию полученных в ходе наблюдений сведений;

— их группировку;

— разработку системы показателей, характеризующих образованные группы;

— создание разработочных таблиц для сгруппированных данных;

— расчет производных величин по разработочным таблицам.

В литературе по теории статистики часто встречается рассмотрение сводки и группировки как самостоятельных этапов исследования. Однако, следует заметить, что понятие сводки включает в себя действия по группировке статистических данных, поэтому здесь в качестве названия этапа исследования принято понятие «сводка».

Статистический анализ – исследование характерных особенностей структуры, связи явлений, тенденций, закономерностей развития социально-экономических явлений, для чего используются специфические экономико-статистические и математико-статистические методы. Статистический анализ завершается интерпретаций полученных результатов.

Статистический прогноз – научное выявление состояния и вероятных путей развития явлений и процессов, основанное на системе установленных причинно-следственных связей и закономерностей.

ЗАДАНИЕ 1

В результате выборочного обследования заработной платы 60-ти работников предприятия промышленности были получены следующие данные (табл. 1).

Постройте интервальный ряд распределения по результативному признаку, образовав пять групп с равными интервалами.

Определите основные показатели вариации (дисперсию, среднее квадратическое отклонение, коэффициент вариации), среднюю степенную величину (среднее значение признака) и структурные средние. Изобразите графически в виде: а) гистограммы; б) кумуляты; в) огивы. Сделайте вывод.

РЕШЕНИЕ

1. Определим размах вариации по результативному признаку – по производственному стажу по формуле:

R = Хmax – Хmin = 36 – 5 = 31

где Хmax – максимальный размер активов

Хmin – минимальный размер активов

2. Определим величину интервала

i = R/n = 31/5= 6,2

с учетом полученной величины интервалов производим группировку банков и получаем

3. Построим вспомогательную таблицу

Группа призна-ка

Значение значений в группе

х i

Количество частота признака (частота)

f i

в % к итогу

ω

Накопленная частота

S i

Середина интервала

* f i

ω

I

5 – 11,2

6,8,7,5,8,6,10,9,9,7, 6,6,9,10,7,9,10,10, 11,8,9,8, 7, 6, 9, 10

43,3

43,3

210,6

350,73

46,24

1202,24

II

11,2 – 17,4

16,15,13,12,14,14, 12,14,17,13,15,17, 14

21,7

14,3

185,9

310,31

0,36

4,68

III

17,4 – 23,6

18,21,20,20,21,18, 19,22,21,21,21,18, 19

21,7

86,7

20,5

266,5

444,85

31,36

407,68

IV

23,6 –29,8

28,29,25,28, 24

26,7

133,5

221,61

11,8

139,24

696,2

V

29,8 – 36

36,35,33,

32,9

98,7

164,5

ИТОГО

895,2

1492

541,2

3282,8

4. Среднее значение признака в изучаемой совокупности определяется по формуле арифметической взвешенной:

года

5. Дисперсия и среднее квадратическое отклонение признака определяется по формуле



Определение колеблемости


Таким образом, V>33,3%, следовательно, совокупность неоднородна.

6. Определение моды

Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. В исследуемом интервальном вариационном ряду мода рассчитывается по формуле:


где

x M0
– нижняя граница модального интервала:

i M0 – величина модального интервала;

f M0-1 f M0 f M0+1 – частоты (частости) соответственно модального, домо-дального и послемодального интервалов.

Модальный интервал – это интервал, имеющий наибольшую частоту (частость). В нашей задаче – это первый интервал.


7. Рассчитаем медиану.

Медиана – вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части, таким образом, что половина единиц совокупности имеют значения признака меньше, чем медиана, а половина– больше, чем медиана.

В интервальном ряду медиана определяется по формуле:


где – начало медианного интервала;

– величина медианного интервала

– частота медианного интервала;

– сумма накопленных частот в домедианном интервале.

Медианный интервал – это интервал, в котором находится порядковый номер медианы. Для его определения необходимо подсчитать сумму накопленных частот до числа, превышающего половину совокупности.

По данным гр. 5 вспомогательной таблицы находим интервал, сумму накопленных часто в котором превышает 50%. Это второй интервал – от 11,6 до 18,4, он и является медианным.

Тогда


Следовательно, половина работников имеющих стаж работы меньше 13,25 лет, а половина – больше этой величины.

6. Изобразим ряд в виде полигона, гистограммы, кумулятивной прямой, огивы.

Графическое представление играет важную роль в изучении вариационных рядов, так как позволяет в простой и наглядной форме проводить анализ статистических данных.

Существует несколько способов графического изображения рядов (гистограмма, полигон, кумулята, огива), выбор которых зависит от цели исследования и от вида вариационного ряда.

Полигон распределения в основном используется для изображения дискретного ряда, но можно построить полигон и для интервального ряда, если предварительно привести его к декретному. Полигон распределения представляет собой замкнутую ломаную линию в прямоугольной системе координат с координатами (x i , q i), где x i — значение i-го признака, q i — частота или частость i-ro признака.

Гистограмма распределения применяется для изображения интервального ряда. Для построения гистограммы на горизонтальной оси откладывают последовательно отрезки, равные интервалам признака, и на этих отрезках, как на основаниях, строят прямоугольники, высоты которых равны частотам или частностям для ряда с равными интервалами, плотностям; для ряда с неравными интервалами.


Кумулята есть графическое изображение вариационного ряда, когда на вертикальной оси откладываются накопленные частоты или частности, а на горизонтальной – значения признака. Кумулята служит для графического представления как дискретных, так и интервальных вариационных рядов.


Вывод: Таким образом, были рассчитаны основные показатели вариации исследуемого ряда: среднее значение признака – производственного стажа составляет 14,9 лет, рассчитана дисперсия равная 54,713, в свою очередь среднее квадратическое отклонение признака – 7,397. Мода имеет значение 9,13, в модальным интервалом является первый интервал изучаемого ряда. Медиана ряда равная 13,108, делит ряд на две равные части говорит о том что в исследуемой организации половина работников имеет стаж работы меньше 13,108 лет, а половина – больше.

ЗАДАНИЕ 2

Имеются следующие исходные данные, характеризующие динамику за 1997 – 2001 г.г. (таблица 2).

Таблица 2 Исходные данные

Год

1997

1998

1999

2000

2001

Выпуск сахарного песка, тыс.т.

1620

1660

1700

1680

1700

Определите основные показатели ряда динамики. Расчет представьте в виде таблицы. Рассчитайте среднегодовые значения показателей. В виде графического изображения – полигона, обозначьте динамику анализируемого показателя. Сделайте вывод.

РЕШЕНИЕ

Дано

Год

Годы

1997

1998

1999

2000

2001

1620

1660

1700

1680

1700

1) Средний уровень динамики рассчитывается по формуле


2) Цепные и базисные темпы роста рассчитываем следующим образом:

1. Абсолютный прирост определяется по формуле:

Аiб = yi – y0

Аiц = yi – yi-1

2. Темп роста определяется по формуле: (%)

Трб = (yi / y0) *100

Трц = (yi / yi-1)*100

3. Темп прироста определяется по формуле: (%)

Тnрб = Трб –100%:

Тnрц = Трц – 100%

4. Средний абсолютный прирост:


y n
– конечный уровень динамического ряда;

y 0
– начальный уровень динамического ряда;

n ц
– число цепных абсолютных приростов.

5. Среднегодовой темп роста:


6. Среднегодовой темп прироста:


3) Абсолютное содержание 1% прироста:

А = Хi-1 / 100

Все рассчитанные показатели сводим в таблицу.

Показатели

Годы

1997

1998

1999

2000

2001

Количество хирургических операций за период

1620

1660

1700

1680

1700

2. Абсолютный прирост

Aiц

3. Темп роста

Трib

102,5

104,9

103,7

104,9

Трiц

102,5

102,4

98,8

101,2

4. Темп прироста

Тпib

Тпiц

5. Значение 1% прироста

16,2

16,6

17,0

16,8

5) Среднегодовое значение


7. Изобразим графически в виде полигона.


Таким образом, получено следующее. Наибольший абсолютный и относительный прирост хирургических операций за период было в 1999 году и составило 1700, абсолютный прирост по сравнению с базисным годом составил 80 операций, темп роста по отношению к базовому 1997 годом равен 104,9%, а базовый темп прирост был 4,9%. Наибольшие цепные абсолютные приросты были в 1998 и 1999 году – по 40 операций. Наибольший цепной темп роста наблюдался в 1998 году – 102,5%, а наименьший цепной темп прироста количества операций составляет в 2000 году – 98,8%.

ЗАДАНИЕ 3

Имеются данные о реализации товаров (см. таблицу 3)

Таблица 3 Исходные данные о реализации товаров

Товар

Базовый год

Отчетный год

кол-во

цена

кол-во

цена

1100

1000

1350

1300

1650

1700

Определить: а) индивидуальные индексы (i p , i q ); б) общие индексы (I p , I q , I pq); в) абсолютное изменение товарооборота за счет: 1) количества товаров; 2) цены.

На основании исчисленных показателей сделайте вывод.

РЕШЕНИЕ

Составим вспомогательную таблицу

Вид

Базисное

Отчетное

Произведение

Индексы

Кол-во, q 0

Цена, p 0

Кол-во, q 1

Цена, p 1

q 0 * p 0

q 1 * p 1

i q =q 1 /q 0

i p =p 1 /p 0

q 1 * p 0

44000

35000

0,875

0,909

38500

1100

1000

41800

40000

0,909

1,053

38000

7500

8400

1,200

0,933

9000

1350

1300

40500

26000

0,667

0,963

27000

45000

44000

1,100

0,889

49500

1650

1700

26400

25500

1,030

0,938

27200

ИТОГО

205200

178900

189200


Вывод: Как видим общий прирост товарооборота за год составил (-26300) усл.ед., включая влияние изменения количества проданного товара на — 16000 и из-за изменения цены на товар – 10300 усл.ед. Общий прирост товарооборота составил 87,2%. Следует отметить, что согласно рассчитанным индексам количества товара по ассортименту наблюдается незначительный прирост товарооборота по товару «П» на 120% и товару «С» 110%, незначительный рост реализации товара «Т» – всего 103%. Довольно значительно снизилась реализации товара «Р» – всего 66,7% от реализации в базисном году, чуть выше реализация товара «Н» – 87,5% и товара «О» – 90,9% от соответствующего показателя базисного года. Индивидуальный индекс цены показывает, что цена выросла лишь на товар «О» – на 105,3%, в то же время по всем остальным наименованиям товара – «Н», «П», «Р», «С», «Т» индивидуальный индекс цен свидетельствует об отрицательной динамике (снижении) соответственно – 90,9%; 93,3%;, 96,3%, 88,9; 93,8.

Общий индекс физического объема реализации свидетельствует о незначительном снижении общего объема реализации на 94,6%; общий индекс цены свидетельствует об общем снижении цены на реализуемые товары на 92,2%, а общий индекс товарооборота говорит об общем снижении товарооборота на 87,2%.

ЗАДАНИЕ 4

Из исходных данных таблицы № 1 (выбрать строки с 14 до 23) по двум признакам – производственному стажу и размеру заработной платы провести корреляционно-регрессионный анализ, определить параметры корреляции и детерминации. Построить график корреляционной зависимости между двумя признаками (результативным и факторным). Сделать вывод.

РЕШЕНИЕ

Исходные данные

Производственный стаж

Размер заработной платы

1800

2500

1750

1580

1750

1560

1210

1860

1355

1480

Прямолинейная зависимость

Параметры уравнения определяются по методу наименьших квадратов, по системе нормальных уравнения


Для решения системы используем метод определителей.

Параметры рассчитывает по формулам