Статистический критерий
Правило, по которому гипотеза Я 0 отвергается или принимается, называется статистическим критерием. В названии критерия, как правило, содержится буква, которой обозначается специально составленная характеристика из п. 2 алгоритма проверки статистической гипотезы (см. п. 4.1), рассчитываемая в критерии. В условиях данного алгоритма критерий назывался бы «в -критерий».
При проверке статистических гипотез возможны два типа ошибок:
- - ошибка первого рода (можно отвергнуть гипотезу Я 0 , когда она на самом деле верна);
- - ошибка второго рода (можно принять гипотезу Я 0 , когда она на самом деле не верна).
Вероятность а допустить ошибку первого рода называется уровнем значимости критерия.
Если за р обозначить вероятность допустить ошибку второго рода, то (l - р) - вероятность не допустить ошибку второго рода, которая называется мощностью критерия.
Критерий согласия х 2 Пирсона
Существует несколько типов статистических гипотез:
- - о законе распределения;
- - однородности выборок;
- - численных значениях параметров распределения и т.д.
Мы будем рассматривать гипотезу о законе распределения на примере критерия согласия х 2 Пирсона.
Критерием согласия называют статистический критерий проверки нулевой гипотезы о предполагаемом законе неизвестного распределения.
В основе критерия согласия Пирсона лежит сравнение эмпирических (наблюдаемых) и теоретических частот наблюдений, вычисленных в предположении определенного закона распределения. Гипотеза # 0 здесь формулируется так: по исследуемому признаку генеральная совокупность распределена нормально.
Алгоритм проверки статистической гипотезы # 0 для критерия х 1 Пирсона:
- 1) выдвигаем гипотезу Я 0 - по исследуемому признаку генеральная совокупность распределена нормально;
- 2) вычисляем выборочную среднюю и выборочное среднее квадратическое отклонение о в;
3) по имеющейся выборке объема п рассчитываем специально составленную характеристику ,
где: я, - эмпирические частоты, - теоретические частоты,
п - объем выборки,
h - величина интервала (разность между двумя соседними вариантами),
Нормализованные значения наблюдаемого признака,
- табличная функция. Также теоретические частоты
могут быть вычислены с помощью стандартной функции MS Excel НОРМРАСП по формуле ;
4) по выборочному распределению определяем критическое значение специально составленной характеристики xl P
5) при гипотеза # 0 отвергается, при гипотеза # 0 принимается.
Пример. Рассмотрим признак X - величину показателей тестирования осужденных в одной из исправительных колоний по некоторой психологической характеристике, представленный в виде вариационного ряда:
На уровне значимости 0,05 проверить гипотезу о нормальном распределении генеральной совокупности.
1. На основе эмпирического распределения можно выдвинуть гипотезу Н 0 : по исследуемому признаку «величина показателя тестирования по данной психологической характеристике» генеральная совокупность осу-
жденных распределена нормально. Альтернативная гипотеза 1: по исследуемому признаку «величина показателя тестирования по данной психологической характеристике» генеральная совокупность осужденных не распределена нормально.
2. Вычислим числовые выборочные характеристики:
Интервалы |
х г щ |
х} щ |
|||||
3. Вычислим специально составленную характеристику j 2 . Для этого в предпоследнем столбце предыдущей таблицы найдем теоретические частоты по формуле , а в последнем столбце
проведем расчет характеристики % 2 . Получаем х 2 = 0,185.
Для наглядности построим полигон эмпирического распределения и нормальную кривую по теоретическим частотам (рис. 6).
Рис. 6.
4. Определим число степеней свободы s : к = 5, т = 2, s = 5-2-1 = 2.
По таблице или с помощью стандартной функции MS Excel «ХИ20БР» для числа степеней свободы 5 = 2 и уровня значимости а = 0,05 найдем критическое значение критерия xl P . =5,99. Для уровня значимости а = 0,01 критическое значение критерия х%. = 9,2.
5. Наблюдаемое значение критерия х =0,185 меньше всех найденных значений Хк Р.-> поэтому гипотеза Я 0 принимается на обоих уровнях значимости. Расхождение эмпирических и теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности. Таким образом, по исследуемому признаку «величина показателя тестирования по данной психологической характеристике» генеральная совокупность осужденных распределена нормально.
- 1. Корячко А.В., Куличенко А.Г. Высшая математика и математические методы в психологии: руководство к практическим занятиям для слушателей психологического факультета. Рязань, 1994.
- 2. Наследов А.Д. Математические методы психологического исследования. Анализ и интерпретация данных: Учеб, пособие. СПб., 2008.
- 3. Сидоренко Е.В. Методы математической обработки в психологии. СПб., 2010.
- 4. Сошникова Л.А. и др. Многомерный статистический анализ в экономике: Учеб, пособие для вузов. М., 1999.
- 5. Суходольский Е.В. Математические методы в психологии. Харьков, 2004.
- 6. Шмойлова Р.А., Минашкин В.Е., Садовникова Н.А. Практикум по теории статистики: Учеб, пособие. М., 2009.
- Гмурман В.Е. Теория вероятностей и математическая статистика. С. 465.
Пример 1 . Используя критерий Пирсона, при уровне значимости 0.05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема n = 200.
Решение
находим с помощью калькулятора .
x i | Кол-во, f i | x i * f i | Накопленная частота, S | (x - x ср) * f | (x - x ср) 2 * f | (x - x ср) 3 * f | Частота, f i /n |
5 | 15 | 75 | 15 | 114.45 | 873.25 | -6662.92 | 0.075 |
7 | 26 | 182 | 41 | 146.38 | 824.12 | -4639.79 | 0.13 |
9 | 25 | 225 | 66 | 90.75 | 329.42 | -1195.8 | 0.13 |
11 | 30 | 330 | 96 | 48.9 | 79.71 | -129.92 | 0.15 |
13 | 26 | 338 | 122 | 9.62 | 3.56 | 1.32 | 0.13 |
15 | 21 | 315 | 143 | 49.77 | 117.95 | 279.55 | 0.11 |
17 | 24 | 408 | 167 | 104.88 | 458.33 | 2002.88 | 0.12 |
19 | 20 | 380 | 187 | 127.4 | 811.54 | 5169.5 | 0.1 |
21 | 13 | 273 | 200 | 108.81 | 910.74 | 7622.89 | 0.065 |
200 | 2526 | 800.96 | 4408.62 | 2447.7 | 1 |
.
Средняя взвешенная
Показатели вариации
.
.
R = X max - X min
R = 21 - 5 = 16
Дисперсия
Несмещенная оценка дисперсии
Среднее квадратическое отклонение .
Каждое значение ряда отличается от среднего значения 12.63 не более, чем на 4.7
.
.
нормальному закону
n = 200, h=2 (ширина интервала), σ = 4.7, x ср = 12.63
i | x i | u i | φ i | n* i |
1 | 5 | -1.63 | 0,1057 | 9.01 |
2 | 7 | -1.2 | 0,1942 | 16.55 |
3 | 9 | -0.77 | 0,2943 | 25.07 |
4 | 11 | -0.35 | 0,3752 | 31.97 |
5 | 13 | 0.0788 | 0,3977 | 33.88 |
6 | 15 | 0.5 | 0,3503 | 29.84 |
7 | 17 | 0.93 | 0,2565 | 21.85 |
8 | 19 | 1.36 | 0,1582 | 13.48 |
9 | 21 | 1.78 | 0,0804 | 6.85 |
i | n i | n* i | n i -n* i | (n i -n* i) 2 | (n i -n* i) 2 /n* i |
1 | 15 | 9.01 | -5.99 | 35.94 | 3.99 |
2 | 26 | 16.55 | -9.45 | 89.39 | 5.4 |
3 | 25 | 25.07 | 0.0734 | 0.00539 | 0.000215 |
4 | 30 | 31.97 | 1.97 | 3.86 | 0.12 |
5 | 26 | 33.88 | 7.88 | 62.14 | 1.83 |
6 | 21 | 29.84 | 8.84 | 78.22 | 2.62 |
7 | 24 | 21.85 | -2.15 | 4.61 | 0.21 |
8 | 20 | 13.48 | -6.52 | 42.53 | 3.16 |
9 | 13 | 6.85 | -6.15 | 37.82 | 5.52 |
∑ | 200 | 200 | 22.86 |
Её границу K kp = χ 2 (k-r-1;α) находим по таблицам распределения «хи-квадрат» и заданным значениям σ, k = 9, r=2 (параметры x cp и σ оценены по выборке).
Kkp(0.05;6) = 12.59159; Kнабл = 22.86
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по нормальному закону
. Другими словами, эмпирические и теоретические частоты различаются значимо.
Пример 2
. Используя критерий Пирсона, при уровне значимости 0.05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема n = 200.
Решение
.
Таблица для расчета показателей.
x i | Кол-во, f i | x i * f i | Накопленная частота, S | (x - x ср) * f | (x - x ср) 2 * f | (x - x ср) 3 * f | Частота, f i /n |
0.3 | 6 | 1.8 | 6 | 5.77 | 5.55 | -5.34 | 0.03 |
0.5 | 9 | 4.5 | 15 | 6.86 | 5.23 | -3.98 | 0.045 |
0.7 | 26 | 18.2 | 41 | 14.61 | 8.21 | -4.62 | 0.13 |
0.9 | 25 | 22.5 | 66 | 9.05 | 3.28 | -1.19 | 0.13 |
1.1 | 30 | 33 | 96 | 4.86 | 0.79 | -0.13 | 0.15 |
1.3 | 26 | 33.8 | 122 | 0.99 | 0.0375 | 0.00143 | 0.13 |
1.5 | 21 | 31.5 | 143 | 5 | 1.19 | 0.28 | 0.11 |
1.7 | 24 | 40.8 | 167 | 10.51 | 4.6 | 2.02 | 0.12 |
1.9 | 20 | 38 | 187 | 12.76 | 8.14 | 5.19 | 0.1 |
2.1 | 8 | 16.8 | 195 | 6.7 | 5.62 | 4.71 | 0.04 |
2.3 | 5 | 11.5 | 200 | 5.19 | 5.39 | 5.59 | 0.025 |
200 | 252.4 | 82.3 | 48.03 | 2.54 | 1 |
Показатели центра распределения
.
Средняя взвешенная
Показатели вариации
.
Абсолютные показатели вариации
.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = X max - X min
R = 2.3 - 0.3 = 2
Дисперсия
- характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Несмещенная оценка дисперсии
- состоятельная оценка дисперсии.
Среднее квадратическое отклонение
.
Каждое значение ряда отличается от среднего значения 1.26 не более, чем на 0.49
Оценка среднеквадратического отклонения
.
Проверка гипотез о виде распределения
.
1. Проверим гипотезу о том, что Х распределено по нормальному закону
с помощью критерия согласия Пирсона.
где n* i - теоретические частоты:
Вычислим теоретические частоты, учитывая, что:
n = 200, h=0.2 (ширина интервала), σ = 0.49, x ср = 1.26
i | x i | u i | φ i | n* i |
1 | 0.3 | -1.96 | 0,0573 | 4.68 |
2 | 0.5 | -1.55 | 0,1182 | 9.65 |
3 | 0.7 | -1.15 | 0,2059 | 16.81 |
4 | 0.9 | -0.74 | 0,3034 | 24.76 |
5 | 1.1 | -0.33 | 0,3765 | 30.73 |
6 | 1.3 | 0.0775 | 0,3977 | 32.46 |
7 | 1.5 | 0.49 | 0,3538 | 28.88 |
8 | 1.7 | 0.89 | 0,2661 | 21.72 |
9 | 1.9 | 1.3 | 0,1691 | 13.8 |
10 | 2.1 | 1.71 | 0,0909 | 7.42 |
11 | 2.3 | 2.12 | 0,0422 | 3.44 |
Сравним эмпирические и теоретические частоты. Составим расчетную таблицу, из которой найдем наблюдаемое значение критерия:
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение K набл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: $.
Для того, чтобы при уровне значимости $\alpha $ проверить гипотезу о том, что непрерывная случайная величина распределена по равномерному закону, требуется:
1) Найти по заданному эмпирическому распределению выборочное среднее $\overline { x_b } $ и $\sigma _b =\sqrt { D_b } $. Принять в качестве оценки параметров $a$ и $b$ величины
$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $
2) Найти вероятность попадания случайной величины $X$ в частичные интервалы $({ x_i ,x_ { i+1 } })$ по формуле $ P_i =P({ x_i 3) Найти теоретические { выравнивающие } частоты по формуле $n_i" =np_i $. 4) Приняв число степеней свободы $k=S-3$ и уровень значимости $\alpha =0,05$ по таблицам $\chi ^2$ найдём $\chi _ { кр } ^2 $ по заданным $\alpha $ и $k$, $\chi _ { кр } ^2 ({ \alpha ,k })$. 5) По формуле $\chi _ { набл } ^2 =\sum { \frac { ({ n_i -n_i" })^2 } { n_i" } } $ где $n_i -$ эмпирические частоты, находим наблюдаемое значение $\chi _ { набл } ^2 $. 6) Если $\chi _ { набл } ^2 <\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу. Проверим гипотезу на нашем примере. 1) $\overline x _b =13,00\,\,\sigma _b =\sqrt { D_b } = 6,51$ 2) $a=13,00-\sqrt 3 \cdot 6,51=13,00-1,732\cdot 6,51=1,72468$ $b=13,00+1,732\cdot 6,51=24,27532$ $b-a=24,27532-1,72468=22,55064$ 3) $P_i =P({ x_i $ P_2 =({ 3 $ P_3 =({ 7 $ P_4 =({ 11 $ P_5 =({ 15 $ P_6 =({ 19 В равномерном распределении если одинакова длина интервала, то $P_i -$ одинаковы. 4) Найдём $n_i" =np_i $. 5) Найдём $\sum { \frac { ({ n_i -n_i" })^2 } { n_i" } } $ и найдём $\chi _ { набл } ^2 $. Занесём все полученные значения в таблицу \begin{array} { |l|l|l|l|l|l|l| } \hline i& n_i & n_i" =np_i & n_i -n_i" & ({ n_i -n_i" })^2& \frac { ({ n_i -n_i" })^2 } { n_i" } & Контроль~ \frac { n_i^2 } { n_i" } \\ \hline 1& 1& 4,43438& -3.43438& 11,7950& 2,659898& 0,22551 \\ \hline 2& 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,11838 \\ \hline 3& 3& 4,43438& -1,43438& 2,05744& 0,471463& 2,0296 \\ \hline 4& 3& 4,43438& -1,43438& 2,05744& 0,471463& 2,0296 \\ \hline 5& 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,11838 \\ \hline 6& 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,11838 \\ \hline & & & & & \sum = \chi _ { набл } ^2 =3,261119& \chi _ { набл } ^2 =\sum { \frac { n_i^2 } { n_i" } -n } =3,63985 \\ \hline \end{array} $\chi _ { кр } ^2 ({ 0,05,3 })=7,8$ $\chi _ { набл } ^2 <\chi _ { кр } ^2 =3,26<7,8$ Вывод
отвергать гипотезу нет оснований. Критерий Пирсона
Критерий Пирсона
, или критерий χ 2
- наиболее часто употребляемый критерий для проверки гипотезы о законе распределения . Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая требует статистической проверки. Обозначим через X исследуемую случайную величину . Пусть требуется проверить гипотезу H
0
о том, что эта случайная величина подчиняется закону распределения F
(x
)
. Для проверки гипотезы произведём выборку, состоящую из n независимых наблюдений над случайной величиной X. По выборке можно построить эмпирическое распределение F
* (x
)
исследуемой случайной величины. Сравнение эмпирического F
* (x
)
и теоретического распределений производится с помощью специально подобранной случайной величины - критерия согласия . Одним из таких критериев и является критерий Пирсона. Для проверки критерия вводится статистика: где - предполагаемая вероятность попадения в i
-й интервал, - соответствующее эмпирическое значение, n
i
- число элементов выборки из i
-го интервала. Эта величина в свою очередь является случайной (в силу случайности X) и должна подчиняться распределению χ 2
. Перед тем, как сформулировать правило принятия или отвержения гипотезы необходимо учесть, что критерий Пирсона обладает правосторонней критической областью .
Wikimedia Foundation
.
2010
.
Критерий Пирсона, или критерий χ² (Хи квадрат) наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая… … Википедия
Или Критерий согласия Колмогорова Смирнова статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… … Википедия
- (максиминный критерий) один из критериев принятия решений в условиях неопределённости. Критерий крайнего пессимизма. История Критерий Вальда был предложен Абрахамом Вальдом в 1955 году для выборок равного объема, а затем распространен на … Википедия
Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона Манна Уитни. Критерий Краскела Уоллиса является ранговым, поэтому он инвариантен по отношению к любому… … Википедия
- (F критерий, φ* критерий, критерий наименьшей значимой разности) апостериорный статистический критерий, используемый для сравнения дисперсий двух вариационных рядов, то есть для определения значимых различий между групповыми средними в… … Википедия
Критерий Кохрена используют при сравнении трёх и более выборок одинакового объёма. Расхождение между дисперсиями считается случайным при выбранном уровне значимости, если: где квантиль случайной величины при числе суммируемых… … Википедия
Статистический критерий, названный по имени Хьюберта Лиллиефорса, профессора статистики Университета Джорджа Вашингтона, являющийся модификацией критерия Колмогорова–Смирнова. Используется для проверки нулевой гипотезы о том, что выборка… … Википедия
Для улучшения этой статьи желательно?: Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное. Добавить иллюстрации. Т Крит … Википедия
В статистике критерий согласия Колмогорова (также известный, как критерий согласия Колмогорова Смирнова) используется для того, чтобы определить, подчиняются ли два эмпирических распределения одному закону, либо определить, подчиняется ли… … Википедия
критерий независимости
- для таблиц сопряженности проверяет гипотезу о том, что переменные строки и столбца независимы. К таким критериям относится критерий независимости хи квадрат (Пирсона) и точный критерий Фишера … Словарь социологической статистики
В некоторых случаях
исследователь не знает заранее, по
какому именно закону распределены
наблюдаемые значение исследуемого
признака. Но у него могут быть достаточно
веские причины предполагать, что
распределение подчинено тому или иному
закону, например, нормальному или
равномерному. В этом случае выдвигаются
основная и альтернативная статистические
гипотезы следующего вида: H
0:
распределение наблюдаемого признака
подчинено закону распределения A
, H
1:
распределение наблюдаемого признака
отличается от A
; где в качестве A
может выступать тот или иной закон
распределения: нормальный, равномерный,
показательный и т. д. Проверка гипотезы
о предполагаемом законе распределения
проводится при помощи так называемых
критериев согласия. Имеется несколько
критериев согласия. Наиболее универсальным
из них является
-критерий
Пирсона, так как он применим к любому
виду распределения. Обычно эмпирические
и теоретические частоты различаются.
Случайно ли расхождение частот? Критерий
Пирсона дает ответ на этот вопрос,
правда, как и любой статистический
критерий, он не доказывает справедливость
гипотезы в строго математическом смысле,
а лишь устанавливает на определенном
уровне значимости ее согласие или
несогласие с данными наблюдений. Итак, пусть по
выборке объема
получено
статистическое распределение значений
признака,
где-
наблюдаемые значения признака,-
соответствующие им частоты: Суть критерия
Пирсона состоит в вычислении критерия
по следующей формуле: где
-
это число разрядов наблюдаемых значений,
а-
теоретические частоты соответствующих
значений. Понятно, что чем
меньше разности
,
тем ближе эмпирическое распределение
к эмпирическому, поэтому, чем меньше
значение критерия,
тем с большей достоверностью можно
утверждать, что эмпирическое и
теоретическое распределение подчинены
одному закону. Алгоритм критерия
Пирсона несложен и состоит в выполнении
следующих действий: Итак, единственным
нетривиальным действием в этом алгоритме
является определение теоретических
частот. Они, разумеется, зависят от
закона распределения, поэтому - для
различных законов определяются
по-разному.
Статистика критерия
Правило критерия
Правило.
Если полученная статистика превосходит квантиль закона распределения заданного уровня значимости с или с степенями свободы , где k - число наблюдений или число интервалов (для случая интервального вариационного ряда), а p - число оцениваемых параметров закона распределения , то гипотеза отвергается. В противном случае гипотеза принимается на заданном уровне значимости .
Литература
См. также
Смотреть что такое "Критерий Пирсона" в других словарях:
Книги
-Критерий Пирсона
Алгоритм критерия Пирсона