Точечная оценка в математической статистике - это число, вычисляемое на основе наблюдений, предположительно близкое оцениваемому параметру. Пусть - выборка из распределения, зависящего от параметра. Тогда статистику называют точечной оценкой параметра.

Свойства точечных оценок:

1. Оценка называется несмещённой, если ее математическое ожидание равно оцениваемому параметру генеральной совокупности:

2. Оценка называется эффективной, если она обладает минимальной дисперсией среди всех возможных точечных оценок.

3. Оценка называется состоятельной, если она по вероятности с увеличением объема выборки n стремится к параметру генеральной совокупности.

Существует несколько методов определения оценок.

Наиболее распространен метод максимального правдоподобия, теоретически обоснованный математиком Р. Фишером. Идея метода заключается в следующем. Вся получаемая в результате многократных наблюдений информация об истинном значении измеряемой величины и рассеивании результатов сосредоточена в ряде наблюдений, где n - число наблюдений. Их можно рассматривать как n независимых случайных величин с одной и той же дифференциальной функцией распределения. Вероятность получения в эксперименте некоторого результата, лежащего в интервале, где - некоторая малая величина, равна соответствующему элементу вероятности.

Независимость результатов наблюдений позволяет найти априорную вероятность появления одновременно всех экспериментальных данных, т.е. всего ряда наблюдений как произведение этих вероятностей:

Если рассматривать Q и как неизвестные параметры распределения, то, подставляя различные значения Q и в эту формулу, мы будем получать различные значения вероятности при каждом фиксированном ряде наблюдений. При некоторых значениях и вероятность получения экспериментальных данных достигает наибольшего значения. В соответствии с методом максимального правдоподобия именно эти значения и принимаются в качестве точечных оценок истинного значения и среднеквадратического отклонения результатов наблюдений. Таким образом, метод максимального правдоподобия сводится к отысканию таких оценок и, при которых функция правдоподобия достигает наибольшего значения. Постоянный сомножитель не оказывает влияния на решение и поэтому может быть отброшен. Полученные оценки и истинного значения и среднеквадратического отклонения называются оценками максимального правдоподобия.

Метод моментов К.Пирсона. Любой теоретический начальный или центральный момент случайной величины, распределение которой зависит от параметра, также зависит от этого параметра.Оценка компонент векторного параметра по методу К.Пирсона осуществляется по определенному количеству моментов различных порядков (начальных, центральных или тех и других). В качестве оценки (приближения) параметра принимается такой вектор, при котором каждый из выбранных теоретических моментов совпадает с соответствующим эмпирическим моментом, вычисленным по выборке. Приравниваем выборочные и теоретические моменты:

41-44. Интервальные оценки параметров генеральной совокупности


Дана выборка (x 1 , x 2 , …, x n) объема n из генеральной совокупности с генеральным средним a и генеральной дисперсией? 2 . Ищется интервал [И 1 , И 2 ], в котором a может находиться с доверительной вероятностью г.

Доверительный интервал для неизвестного математического ожидания a при известной дисперсии

Предполагая, что предварительно определена точечная оценка a - выборочное среднее, в качестве статистики для получения И 1 = И 1 (x 1 , x 2 , …, x n) и И 2 =И 2 (x 1 , x 2 , …, x n) рассмотрим нормированное выборочное среднее, имеющее нормальное распределение ().

Где - функция Лапласа.

Полагаем.

доверительный интервал:

Точность оценки: .

При исследовании случайной величины Х по результатам её испытаний часто требуется найти закон её распределения. Тип распределения можно угадать по виду гистограммы или полигона. Будем называть выбранное нами распределение теоретическим . Каждое теоретическое распределение содержит один или более параметров a 1 , a 2 , … , a S , которым должны быть присвоены некоторые значения. Например, экспоненциальное распределение с плотностью вероятностей f(x) = lexp(-lx) содержит один параметр l , а нормальное распределение с плотностью

содержит два параметра m и s . Параметры теоретического распределения нужно выбирать, очевидно, так, чтобы полученное распределение как можно лучше согласовывалось с опытными данными, то есть с выборкой. Другими словами, теория должна как можно точнее описывать эксперимент. Одним из способов выбора параметров теоретического распределения является метод моментов : параметры a 1 , a 2 , … ,a k выбираются так, чтобы k первых моментов теоретического распределения совпадали с их выборочными оценками.

Рассмотренные нами в начале параграфа распределения содержат один или два параметра. Первыми двумя моментами являются математическое ожидание и дисперсия. Поэтому метод моментов в нашем случае сводится к такому выбору одного или двух параметров теоретического распределения, чтобы выполнялось первое или или равенства:

m x = ; = , (1.24)

где и – оценки математического ожидания и дисперсии по выборке.

Например, в случае экспоненциального распределения имеется только один параметр l , при этом m x = и из первого равенства (1.24) получаем l = . В случае же нормального распределения параметров два, при этом m x = m и , поэтому из обоих равенств (1.24) получаем два параметра: и .

Отметим, что метод моментов является лишь одним из возможных методов определения параметров теоретического распределения. Для некоторых типов распределений он может дать плохие результаты. Рассмотрим, например, равномерное распределение с плотностью , x Î . Его параметры a и b связаны с m x и равенствами и . Метод моментов приводит к системе уравнений:

Может случиться, что найденная из этой системы нижняя граница распределения a , окажется больше некоторых значений из выборки, или же верхняя граница b окажется меньше некоторых выборочных значений. Теоретическое распределение с такими параметрами a и b следует сразу же отвергнуть как противоречащее условию, что все значения Х должны принадлежать отрезку .

В случае равномерного распределения следует выбирать значения:

; , (1.25)

которые не приводят к описанным выше противоречиям. Если имеется группированная выборка, то а – левая граница первого разряда, b – правая граница последнего разряда.

Аналогичным образом можно определить некоторые из параметров других ограниченных распределений. Рассмотрим, например, смещённое экспоненциальное распределение с плотностью:

(1.26)

сосредоточенное на интервале (а, ¥) . Параметр сдвига а определяется из первого соотношения (1.25), а для определения l используем метод моментов, приравнивая математические ожидания: , откуда .

Критерии согласия.

Относительно имеющейся выборки S могут быть высказаны какие–то предположения или гипотезы . Например, мы можем выдвинуть гипотезу о том, что исследуемая случайная величина Х имеет нормальное распределение. Методы проверки гипотез в математической статистике называют критериями .

В общем случае проверка гипотезы производится следующим образом. Пусть относительно выборки S выдвинута гипотеза Н 0 . Критерием является некоторая функция U = U (S , H 0) . Вся область значений D критерия U делится на две области D 0 и D 1 . Если вычисленное значение критерия принадлежит области D 0 , то гипотеза H 0 принимается, в противном случае Н 0 отвергается. Область D 0 называется областью допустимых значений или областью принятия гипотезы , область D 1 называется областью отклонения гипотезы или критической областью .


Поясним это следующим примером. Пусть выдвинута гипотеза Н 0 , что вероятность события А равна 0,6 . В серии же из 100 опытов событие произошло m раз. В качестве критерия примем функцию U = | m/100–0,6| , то есть отклонение относительной частоты события А в серии из 100 испытаний от предлагаемой вероятности 0,6 . Множество значений D критерия есть отрезок . Естественно принимать гипотезу Н 0 , если m/100 не слишком отличается от 0,6 и отвергать, если разница велика, например, превышает 0,2 . Таким образом, Н 0 принимается, если значение U = |m/100–0,6| £ 0,2 , и отвергается, если U > 0,2 . Для этого примера области D 0 и D 1 показаны на рис.1.8.

Рис.1.8. Допустимая и критическая области принятия решения.

Выборка S является случайной, поэтому и U(S , H 0) является случайной величиной. Следовательно, принятие или отклонение гипотезы – случайные события и при проверке гипотез возможны следующие ошибки.

1. Гипотеза верна, но отвергается (ошибка первого рода ).

2. Гипотеза неверна, но принимается (ошибка второго рода ).

Вероятность b ошибки первого рода называют уровнем значимости критерия. Таким образом, уровень значимости есть вероятность отвергнуть истинную гипотезу.

Если - вероятность ошибки второго рода, то называется мощностью критерия . Это вероятность отвержения неверной гипотезы.

Вероятности обеих ошибок желательно минимизировать, но оказывается, что попытка уменьшить вероятность одной ошибки приводит к увеличению вероятности другой. Поэтому вероятность одной из ошибок задаётся, а вероятность второй ошибки стараются сделать минимальной.

Чаще всего для проверки гипотез о законах распределения применяется критерий согласия χ 2 (хи-квадрат), предложенный К.Пирсоном. Рассмотрим этот критерий.

Пусть имеется группированная выборка S и выдвинута гипотеза H 0 , что случайная величина Х имеет функцию распределения F(x) . Если бы гипотеза Н 0 была верна, то вероятность попадания значения Х в i –ый частичный интервал была бы равна

P i = F(a i +1) – F(a i) , (1.27)

а математическое ожидание числа попаданий Х в этот полуинтервал, то есть ожидаемая или теоретическая частота была бы равна

n i = nР i , (1.28)

где n = m 1 + m 2 + … + m k . Критерий χ 2 оценивает меру расхождения теоретическихnP i и статистических (или выборочных ) частот m i :

χ 2 = . (1.29)

Чем больше отличаются m i от nP i , тем больше значение χ 2

К.Пирсон доказал, что при истинности H 0 распределение случайной величины (1.29) при n®¥ неограниченно приближается к так называемому c 2 – распределению , независимо от вида распределения F(x) . Это приближение к c 2 – распределению можно считать удовлетворительным, если все частоты m i достаточно велики. Будем поэтому предполагать, что все m i ≥ 6 .

Следует отметить, что между теоретическими частотами n i = nP i и статистическими частотами m i имеются некоторые связи. Одна связь имеется всегда:

n 1 + n 2 + … + n k = m 1 + m 2 + … + m k = n . (1.30)

Другие связи появляются при оценке параметров теоретического распределения по выборке. Если, например, приравнены теоретическое и выборочное среднее, то имеется одна дополнительная связь. Если приравнены ещё и дисперсии, то дополнительных связей будет две. Эти связи приводят к зависимости слагаемых в выражении (1.29) между собой.

Наличие связей учитывается определением числа независимых слагаемых в выражении (1.29), называемом числом степеней свободы , которое определяется по формуле:

r = k – 1 – s , (1.31)

где k – число частичных интервалов группированной выборки, s – число дополнительных связей (кроме связи (1.30)) между теоретическим распределением и выборкой. Число s равно количеству параметров теоретического распределения, определённых именно по выборке. В это число не входят параметры, определённые по каким – либо соображениям независимо от выборки. Например, может быть известно заранее, что X имеет нулевое математическое ожидание. Тогда при гипотезе о нормальном распределении будет наложена только одна дополнительная связь – приравниваются теоретическая и выборочная дисперсии. Дополнительных связей может и вообще не быть (s = 0) , если, к примеру, без предварительного анализа выборки (или даже до её получения) выдвинуть гипотезу о теоретическом распределении с фиксированными значениями входящих в него параметров.

Распределение вероятностей типа c 2 полностью определяется числом степеней свободы r , в зависимости от которого составляются таблицы этого распределения, и F r (x) – функция распределения случайной величины c 2 с r степенями свободы.

Пусть число степеней свободы r определено. Допустим, что c 2 b удовлетворяет равенству: F r () = 1 – b . Это означает, что:

P(c 2 > ) = b , (1.32)

то есть вычисленное по формуле (1.29) значение c 2 (в случае истинности гипотезы Н 0 ) превосходит значение с вероятностью b .

Таким образом, если гипотезу Н 0 принимать в случае c 2 £ и отвергать при c 2 > , то верная гипотеза Н 0 будет отвергаться с вероятностью b , то есть b является уровнем значимости сформулированного критерия. Критические значения даны в приложении 2в зависимости от уровня значимости b и числа степеней свободы r .

Итак, применение критерия c 2 сводится к следующему. Выбирается (или задаётся) уровень значимости b . По группированной выборке с частотами m i не менее шести вычисляется значение c 2 по формуле (1.29). По найденному числу степеней свободы r и заданному b находится критическое значение из таблицы в приложении 2. Применяется решающее правило:

c 2 £ ® H 0 принимается,

c 2 > ® H 0 отвергается.

Если в имеющейся группированной выборке встречаются частоты, которые меньше шести, то следует объединить некоторые соседние интервалы, чтобы все частоты m i были не менее шести.

Если некоторая гипотеза о теоретическом распределении F(x) в результате применения критерия была принята, F(x) может использоваться в дальнейшем для решения различных задач о случайной величине Х (но до тех пор, пока не будут получены экспериментальные данные, которым гипотеза Н 0 противоречит). Если же Н 0 оказалась отвергнутой, то следует подобрать и проверить гипотезу о другом теоретическом распределении, которая выглядит достаточно правдоподобно на фоне имеющихся экспериментальныхданных.

Замечание . Если гипотеза H 0 оказалось принятой , то это еще не значит, что она верна , так как имеется некоторая вероятность ошибки второго рода. Гипотеза H 0 принята не потому, что она верна (так это или не так, нам неизвестно), а потому, что она выглядит правдоподобной при имеющейся выборке S. Аналогично, если гипотеза H 0 отвергнута , то не следует категорически утверждать, что она ложна , так как возможна ошибка первого рода (отвергнуть верную гипотезу). Уровень значимости β и есть вероятность такой ошибки. Мы отвергаем гипотезу потому, что она выглядит неправдоподобной при имеющихся наблюдениях, т.е. выборке S. Напомним, что ошибки в проверке гипотез проистекают из-за случайности значений выборки, что связано с тем, что эти значения – результаты испытаний случайной величины.

Следует отметить, что определяемое по данному уровню значимости критическое значение содержит некоторую погрешность, так как распределении величины (1.29) несколько отличается от распределения c 2 . Это отличие вызвано конечностью объёма выборки и способом выбора значений параметров теоретического распределения. Более корректным в данной ситуации является метод минимума c 2 , состоящий в том, что параметры теоретического распределения выбираются так, чтобы величина (1.29) приняла минимально возможное значение. Однако этот метод трудно реализуем и поэтому применяется редко.


Похожая информация.


С какой оценки начинать? Одним из наиболее известных и простых в употреблении методов является метод моментов. Название связано с тем, что этот метод опирается на использование выборочных моментов

где x1, x2,…, xn - выборка, т.е. набор независимых одинаково распределенных случайных величин с числовыми значениями.

В прикладной статистике метод анализа данных называется методом моментов , если он использует статистику

где g : R q > R k - некоторая функция (здесь k - число неизвестных числовых параметров). Чаще всего термин «метод моментов» используют, когда речь идет об оценивании параметров. В этом случае обычно предполагают, что плотность вероятности распределения элементов выборки f (x ) входит в заранее известное статистику параметрическое семейство {f (x ;и), иєИ}, т.е. f (x ) = f (x ;и 0) при некотором и 0 . Здесь И - заранее заданное k -мерное пространство параметров, являющееся подмножеством евклидова пространства R k , а конкретное значение параметра и 0 статистику неизвестно, его и следует оценить. Известно также, что неизвестный параметр определяется с помощью известной статистику функции через начальные моменты элементов выборки:

В методе моментов в качестве оценки и 0 используют статистику Y n вида (1), которая отличается от формулы (1) тем, что теоретические моменты заменены выборочными.

Статистики Y n вида (1) применяются не только для оценивания параметров, но и для непараметрического оценивания характеристик случайной величины, таких, как коэффициент вариации, и для проверки гипотез. Во всех случаях применения статистики Y n вида (1) говорят о методе моментов.

Распределение вектора Y n во всех практически важных случаях является асимптотически нормальным. Это утверждение опирается на следующий общий факт.

Пусть случайный вектор Z n є R q асимптотически нормален с математическим ожиданием z ? и ковариационной матрицей ||c ij ||/n , а функция h : R q > R 1 достаточно гладкая. Тогда случайная величина h (Z n ) асимптотически нормальна с математическим ожиданием h (z ?) и дисперсией

Для получения асимптотического распределения статистики Y n вида (1) можно применить метод линеаризации к асимптотически нормальному вектору выборочных моментов (M n 1 , M n 2 , …, M n q) и функции g из формулы (1).

Для применения формулы (3) необходимо использовать асимптотические дисперсии и ковариации выборочных моментов, т.е. величины, обозначенные в формуле (3) как c rs . Эти величины имеют вид:

Здесь м r - теоретический центральный момент порядка r , т.е.

Таким образом, для получения асимптотического распределения случайной величины Y n вида (1) достаточно знать теоретические центральные моменты результатов наблюдений и вид функции g .

Однако моменты неизвестны. Их приходится оценивать. В соответствии с теоремами о наследовании сходимости для нахождения асимптотического распределения функции от выборочных моментов можно воспользоваться не теоретическими моментами, а их состоятельными оценками. Эти оценки можно получить разными способами. Можно непосредственно применить формулы (4), заменив теоретические моменты выборочными. Можно выразить моменты через параметры рассматриваемого распределения.

Для оценивания параметров гамма-распределения воспользуемся известной формулой, согласно которой для случайной величины Х , имеющей гамма-распределение с параметрами формы а , масштаба b =1 и сдвига c=0,

Следовательно, M (X ) = a , M (X 2) = a (a +1), D (X ) = M (X 2) - (M (X )) 2 = a (a +1) - a 2 = a . Найдем третий центральный момент M (X - M (X )) 3 . Справедливо равенство

M (X - M (X )) 3 = M (X 3) - 3 M (X 2) M (X ) + 3 M (X) (M (X )) 2 - (M (X )) 3

Из равенства (6) вытекает, что

M (X - M (X )) 3 = a (a +1)(a +2) - 3 a (a +1) a + 3 a a 2 - a 3 = 2a .

Если Y - случайная величина, имеющая гамма-распределение с произвольными параметрами формы a , масштаба b и сдвига c , то Y = bX + c . Следовательно, M (Y ) = ab +c , D (Y ) = ab 2 , M (Y - M (Y )) 3 = 2 a b 3 .

Метод моментов является универсальным. Однако получаемые с его помощью оценки лишь в редких случаях обладают оптимальными свойствами. Поэтому в прикладной статистике применяют и другие виды оценок.

2.3.1. Метод моментов проверки гипотез

К методу моментов относят все статистические процедуры, основанные на использовании выборочных моментов и функций от них. Метод моментов оценивания параметров распределения рассмотрен в главе 2.2. В непараметрической статистике на основе выборочных моментов проводится точечное и интервальное оценивание характеристик распределения, таких, как математическое ожидание, дисперсия, среднее квадратическое отклонение, коэффициент вариации (глава 3.1). Для проверки гипотез в непараметрической статистике также используется метод моментов. Примером является критерий Крамера-Уэлча, предназначенный для проверки равенства математических ожиданий по двум независимым выборкам (глава 3.1).

В практике применения статистических методов (согласно классическим схемам) довольно часто возникает необходимость проверки гипотезы о том, что функция распределения результатов наблюдений Х 1 , Х 2 , … , Х n принадлежит параметрическому семейству распределений {F (x , θ), θ Θ}, где Θ R k . Как проверять эту гипотезу?

Давно разработан универсальный метод – критерий минимума хи-квадрат . Однако у него имеется существенный недостаток – необходимость группирования наблюдений, что приводит к потере информации. Как хорошо известно , это приводит к существенному снижению мощности критерия минимума хи-квадрат по сравнению с критериями типа Колмогорова и типа омега-квадрат. Кроме того, нахождение минимума статистики хи-квадрат – достаточно сложная вычислительная процедура. Поэтому иногда вместо оценок, получаемых при указанной оптимизации, подставляют оценки максимального правдоподобия или какие-либо еще. Такая замена приводит к тому, что распределение рассматриваемой статистики существенно отличается от классического, причем различие не исчезает при росте объема выборки. Предложенная член-корр. АН СССР Л.Н. Большевым и проф. М.С. Никулиным модификация критерия минимума хи-квадрат не снимает недостатков, связанных с группированием и необходимостью существенной вычислительной работы.

Общий подход, основанный на дистанционном методе, предложен Дж. Вольфовицем (США) в 1950-х годах. Согласно этому методу следует основываться на том или ином расстоянии между эмпирической функцией распределения и параметрическим семейством распределений (как многообразием в пространстве всех функций распределения). Конкретная реализация этого подхода приводит к критериям типа Колмогорова и типа омега-квадрат. Однако для каждого конкретного параметрического семейства приходится разрабатывать самостоятельную теорию и рассчитывать только ему соответствующие предельные и точные распределения . Предельные распределения найдены лишь для нескольких семейств, а точных почти ничего не известно. До сих пор часто делают ошибку, применяя для произвольных семейств предельные распределения, найденные для проверки согласия с фиксированным распределением (см. подробности в главе 1.2).

Отметим, что критерии минимума хи-квадрат и аналогичные им не являются состоятельными, поскольку вероятности попадания в области группирования не задают однозначно функцию распределения. С этим недостатком можно бороться, увеличивая число интервалов группирования вместе с ростом объема выборки, однако на этом пути еще не выработаны рекомендации, пригодные для широкого практического использования. Критерии типа Колмогорова и типа омега-квадрат – состоятельные, т.е. любую альтернативную функцию распределения, не входящую в рассматриваемое параметрическое семейство, они отвергают с вероятностью, стремящейся к 1 при росте объема выборки.

Для конкретности обсудим проверку согласие результатов наблюдений с трехпараметрическим семейством гамма-распределений с плотностями

(1)

Здесь a >2 - параметр формы, b >0 - параметр масштаба и с - параметр сдвига, Γ(а) - одна из используемых в математике специальных функций, так называемая "гамма-функция". Критерий минимума хи-квадрат имеет указанные выше недостатки. Критерии типа Колмогорова и типа омега-квадрат для этого случая не разработаны.

В подобных ситуациях целесообразно строить критерии согласия на основе функций от выборочных моментов, т.е. пользоваться методом моментов. Для оценивания параметров метод моментов хорошо известен и обычно рассматривается в учебной литературе по теории вероятностей и математической статистике. Реализацией метода моментов для проверки нормальности являются известные критерии асимметрии и эксцесса .

Пример 1. Если случайная величина Х имеет нормальное распределение с математическим ожиданием а и дисперсией σ 2 , то, как известно ,

где δ – нормированное среднее абсолютное отклонение, γ 1 – коэффициент асимметрии и (β 1 – 3) – коэффициент эксцесса. Таким образом, если выборочные оценки указанных моментных отношений существенно отличаются от соответствующих теоретических значений, то следует признать, что распределение результатов наблюдений отлично от нормального. Так как указанные выше значения моментных отношений могут приниматься и для распределений, отличных от нормальных, то близость выборочных значений к только что выписанным не обязательно свидетельствует о нормальности распределения результатов наблюдений. Критерии, полученные методом моментов, служат не столько для проверки нормальности, сколько для выявления отклонений распределения от нормального, или, точнее, для проверки гипотез δ ≠ , γ 1 ≠ 0, β 1 ≠ 3. Рассматриваемые критерии построены на основе выборочных моментных отношений:

Здесь, как обычно, - выборочное среднее арифметическое и s 2 – выборочная дисперсия, соответственно, s – выборочное среднее квадратическое отклонение. Как вытекает из результатов главы 1.4, все три статистики являются асимптотически нормальными. Выражения для параметров их асимптотических распределений приведены в . Процентные точки распределений рассматриваемых выборочных моментных отношений при конечных объемах выборки найдены в предположении нормальности результатов наблюдений .

Как и критерии минимума хи-квадрат, критерии метода моментов никогда не являются состоятельными. Однако они, как и в случае критериев асимметрии и эксцесса, позволяют в ряде случаев отвергнуть гипотезу согласия. Использование несостоятельных критериев часто встречается в прикладной статистике. Отметим, например, что применение критерия Вилкоксона для проверки гипотезы однородности двух выборок широко распространено, хотя против общей альтернативы он является несостоятельным (см. главу 3.1).

Критерии метода моментов основаны на использовании функций от выборочных моментов, имеющих асимптотически нормальные распределения, параметры которых легко могут быть вычислены по методике, описанной в главе 1.4. Метод моментов по сравнению с другими методами проверки согласия требует существенно меньше вычислений (число операций пропорционально объему выборки). Поэтому он может быть рекомендован для использования при проверке согласия с семействами распределений, для которых не разработаны более совершенные методы, а также в качестве быстрого (экспрессного) метода. Что же касается хорошо изученных семейств, например, нормального, то основанные на использовании моментов критерии асимметрии и эксцесса применять для проверки нормальности нецелесообразно. Судя по специальным исследованиям, следует рекомендовать критерий W Шапиро - Уилка.

Продемонстрируем применение метода моментов на примере проверки гипотезы согласия с двухпараметрическим семейством гамма-распределений без сдвига, т.е. выделяемого из семейства (1) условием с =0. Поскольку для трехпараметрического семейства гамма-распределений (1)

М (Х ) =ab + c, D (X ) = ab 2 , μ 3 = M (X – M (X )) 3 = 2ab 3 ,

то при справедливости гипотезы Н 0: с = 0 выполнено соотношение

. (2)

Для специалистов по техническим наукам большое значение имеет альтернативная гипотеза

H 1: c > 0.

В частности, она связана с дискуссией о выборе нормируемых показателей надежности технических устройств. Альтернативная гипотеза соответствует предположению, что в течение некоторого времени (до момента c > 0) отказы невозможны, а нулевая – с отрицанием этого предположения и признанием того, что отказы возможны в любой момент.

При справедливости альтернативной гипотезы

,

поэтому для проверки гипотезы согласия в рассматриваемой постановке целесообразно использовать критерий со статистикой

С помощью описанной в главе 1.4 методики вычисления предельного распределения функции от выборочных моментов можно установить, что при n → ∞ распределение статистики сходится к нормальному, причем при справедливости нулевой гипотезы, т.е. соотношения (2), асимптотическое распределение имеет нулевое математическое ожидание и дисперсию

. (3)

Поскольку параметр формы а неизвестен статистику, необходимо в выражении (3) заменить а на его состоятельную оценку, например, на оценку метода моментов (см. главу 2.2)

Рассмотрим критерий с критической областью вида

, (4)

где u (1 - α) – квантиль порядка 1 - α стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. При n →∞ уровень значимости этого критерия стремится к α.

Если альтернативная гипотеза является двусторонней, т.е. , то аналогично строится двусторонняя критическая область.

Критерий (4) состоятелен против альтернативы H 1: c > 0, а также против непараметрической альтернативы

в которой не предполагается, что функция распределения элементов выборки имеет гамма-распределение (1) с какими-либо конкретными значениями параметров, но не является состоятельным против общей альтернативы.

Пример 2. Применим критерий (4) для проверки согласия с гамма-распределением при с = 0, т.е. с двухпараметрическим семейством, данных о наработке n = 50 резцов до предельного состояния (в часах), приведенных в табл.2 подраздела 2.2.1.

Для рассматриваемых данных = 57,88, s 2 = 663,00, выборочный третий центральный момент m 3 = 14927,91, откуда Z = - 0,01719. При этом a * = 5,05, и потому

.

Следовательно, гипотеза согласия рассматриваемых данных с двухпараметрическим гамма-распределением не отвергается на любом из обычно используемых уровней значимости, как для односторонней критической области, так и для двухсторонней.

Предыдущая

В процессе вычисления средней арифметической и использования ее в анализе социально-экономических процессов может оказаться полезным знание ряда ее математических свойств, которые мы приведем без развернутых доказательств.

Свойство 1. Средняя арифметическая постоянной величины равна этой постоянной: при

Свойство 2. Алгебраическая сумма отклонений индивидуальных значений признака от средней арифметической равна нулю: для несгруппированных данных и для рядов распределения.

Это свойство означает, что сумма положительных отклонений равна сумме отрицательных отклонений, т.е. все отклонения, обусловленные случайными причинами взаимно погашаются.

Свойство 3. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической есть число минимальное: для несгруппировочных данных и для рядов распределения. Это свойство означает, что сумма квадратов отклонений индивидуальных значений признака от средней арифметической всегда меньше суммы отклонений вариантов признака от любого другого значения, даже мало отличающегося от средней.

Второе и третье свойство средней арифметической применяются для проверки правильности расчета средней величины; при изучении закономерностей изменения уровней ряда динамики; для нахождения параметров уравнения регрессии при изучении корреляционной связи между признаками.

Все три первых свойства выражают сущностные черты средней как статистической категории.

Следующие свойства средней рассматриваются как вычислительные, поскольку они имеют некоторое прикладное значение.

Свойство 4. Если все веса (частоты) разделить на какое-либо постоянное число d, то средняя арифметическая не изменится, поскольку это сокращение в равной степени коснется и числителя и знаменателя формулы расчета средней.

Из этого свойства вытекают два важных следствия.

Следствие 1. Если все веса равны между собой, то вычисление средней арифметической взвешенной можно заменить вычислением средней арифметической простой.

Следствие 2. Абсолютные значения частот (весов) можно заменять их удельными весами.

Свойство 5. Если все варианты разделить или умножить на какое-либо постоянное число d, то средняя арифметическая уменьшиться или увеличиться в d раз.

Свойство 6. Если все варианты уменьшить или увеличить на постоянной число A, то и со средней произойдут аналогичные изменения.

Прикладные свойства средней арифметической можно проиллюстрировать, применив способ расчета средней от условного начала (способ моментов).

Средняя арифметическая способом моментов вычисляется по формуле:

где А – середина какого-либо интервала (предпочтение отдается центральному);



d – величина равновеликого интервала, или наибольший кратный делитель интервалов;

m 1 – момент первого порядка.

Момент первого порядка определяется следующим образом:

.

Технику применения этого способа расчета проиллюстрируем по данным предшествующего примера.

Таблица 5.6

Стаж работы, лет Число рабочих Середина интервала x
до 5 2,5 -10 -2 -28
5-10 7,5 -5 -1 -22
10-15 12,5
15-20 17,5 +5 +1 +25
20 и выше 22,5 +10 +2 +22
Итого Х Х Х -3

Как видно из расчетов, приведенных в табл. 5.6 из всех вариантов вычитается одно из их значений 12,5, которое приравнивается нулю и служит условным началом отсчета. В результате деления разностей на величину интервала – 5 получают новые варианты.

Согласно итогу табл. 5.6 имеем: .

Результат вычислений по способу моментов аналогичен результату, который был получен применением основного способа расчета по средней арифметической взвешенной.