Обнаружение гетероскедастичности

В случае парной регрессии о проявлении гетероскедастичности можно судить по характеру расположения экспериментальных точек на корреляционном поле (рис. 5.1). На рис. 5.1 можно заметить, что дисперсии случайных отклонений неодинаковы и увеличиваются с возрастанием значений объясняющей переменной. Однако даже для парной регрессии выводы по определению гетероскедастичности могут являться неоднозначными при наличии локальных «выбросов» точек (пиков на диаграмме рассеивания). Естественно, что для множественной регрессии обнаружение гетероскедастичности является значительно более сложной задачей, чем для моделей с одним регрессором.

В настоящее время существует достаточно большое количество тестов для поверки на гетероскедастичность, базирующихся на дисперсионном анализе случайных отклонений. Рассмотрим наиболее распространенные из них.

Тест ранговой корреляции Спирмена . Идея данного теста заключается в том, что в случае гетероскедастичности дисперсия случайного отклонения будет либо увеличиваться, либо уменьшаться с увеличением значений регрессоров Х . Поэтому для регрессионной модели, построенной по МНК, абсолютные значения оценок отклонений e i и значения x i будут коррелированны.

Значения e i и x i ранжируются (упорядочиваются по величинам). Номеру i значения x i в упорядоченном ряду будет соответствовать ранг r xi . Аналогично упорядочим данные по абсолютным значениям остатков и каждому |e i | припишем ранг r ei . Тогда разность между рангами (d i ) запишем как d i = r xi - r ei . Например, если x 20 является 25-м по величие среди всех значений X , а e 20 является 30-м, то d i = 25 - 30 = -5.

Коэффициент ранговой корреляции Спирмена вычисляется по формуле

(5.2)

где n - число наблюдений.

Доказано, что при n > 10 статистика

(5.3)

имеет t -распределение Стьюдента с числом степеней свободы v = n - 2.

Следовательно, в соответствии со схемой проверки статистических гипотез, если наблюдаемое значение t -статистики, рассчитанное по формуле (5.3), превышает t кр = t a , n - 2 (табличное), то необходимо отклонить гипотезу Н 0 об отсутствии гетероскедастичности. В противном случае гипотеза Н 0 принимается, что соответствует гомоскедастичности.

Если анализируется модель множественной регрессии, то проверка гипотезы осуществляется с помощью t -статистики для каждой объясняющей переменной отдельно.

Следует заметить, что коэффициент ранговой корреляции Спирмена (r ) может иметь самостоятельное значение в эконометрических исследованиях. Он используется при установлении тесноты связи между порядковыми переменными. В этом случае анализируемые объекты упорядочивают по степени влияния (проявления) признака. Если объекты ранжированы по двум признакам Х иY , то имеется возможность оценить тесноту связи между этими переменными, основываясь на рангах. В том случае, если ранги всех объектов равны, то r = 1 (полная прямая связь). При полной обратной связи ранги объектов по двум переменным расположены в обратном порядке и r = -1. Во всех остальных случаях |r | < 1. Применение коэффициента ранговой корреляции не требует нормального распределения переменных и линейной связи между ними. Однако необходимо учитывать, что в случае количественных переменных переход от их первоначальных значений и размерностей к рангам сопровождается определенной потерей информации.

Тест Голдфелда-Квандта. Этот тест использует предположения о нормальности распределения случайных отклонений и о пропорциональности средних квадратических (стандартных) отклонений σ i = σ(e i ) значениям соответствующей объясняющей переменной X .

В рамках этих предположений Голдфелд и Квандт предложили следующую процедуру проверки на гетероскедастичность:

1. Все n наблюдений упорядочиваются в порядке возрастания значений регрессора X , и выборка после этого разбивается на три подвыборки размерностей k , n - 2k , k соответственно.

2. Оцениваются отдельные регрессии для первой и третьей подвыборок (рассматриваем k первых значений и k последних; средние n - 2k наблюдений отбрасываем).

3. Если, в соответствии с нашим предположением, дисперсия случайных отклонений увеличивается с ростом X , то дисперсия регрессии по первой подвыборке (сумма квадратов остатков ) будет существенно меньше дисперсии регрессии по третьей подвыборке (суммы квадратов остатков ).

4. Для сравнения соответствующих дисперсий определяется следующая F -статистика:

. (5.4)

Здесь (k - m - 1) – числа степеней свободы соответствующих выборочных дисперсий (m - одинаковое количество объясняющих переменных в уравнениях регрессии). При выполнении начальных предположений относительно остатков построенная F -статистика имеет распределение Фишера с числами степеней свободы v 1 = v 2 = k - m - 1.

5. Если наблюдаемое значение F -статистики (F набл ), рассчитанное по формуле (5.4), превосходит ее критическое значение , то гипотеза об отсутствии гетероскедастичности (о равенстве дисперсий) отклоняется на выбранном уровне значимости a.

Мощность теста Голдфелда-Квандта, т. е. вероятность отвергнуть гипотезу об отсутствии гетероскедастичности в случае, когда ее действительно нет, оказывается максимальной, если выбирать k » n /3.

Для множественной регрессии данный тест может осуществляться для каждой из объясняющих переменных или для одного выбранного регрессора, который в наибольшей степени связан с σ i .

Аналогичный тест может быть использован при условии обратной пропорциональности между стандартными отклонениями остатков σ i и значениями объясняющей переменной. При этом статистика Фишера примет вид: F = S 1 /S 3 .

Тест Уайта. Сущность данного теста заключается в том, что если в модели присутствует гетероскедастичность, то дисперсии случайных отклонений некоторым образом зависят от регрессоров; т. е. гетероскедастичность должна как-то проявляться в поведении остатков исходной регрессионной модели. Исходя из этого при использовании теста Уайта предполагается, что дисперсии остатков представляют собой некоторую функцию от наблюдаемых значений объясняющих переменных

Для получения соответствующих выводов осуществляется оценка функции (5.5) с помощью уравнения регрессии для квадратов остатков:

где v i - случайный член.

На практике чаще всего функция f выбирается квадратичной, а регрессоры в уравнении (5.6) – это регрессоры исходной модели, их квадраты и, возможно, попарные произведения. Для данного теста гипотеза об отсутствии гетероскедастичности, что соответствует условию f = const , принимается в случае незначимости регрессии (5.6) в целом.



Следует заметить, что во всех рассматриваемых тестах (критериях) осуществляется проверка нулевой гипотезы Н 0 об отсутствии гетероскедастичности.

Постоянство дисперсии случайных остатков называют гомоскедастичностью случайных остатков. Напротив, если эта дисперсия не постоянна, то такое явление называют гетероскедастичностью случайных остатков.

Проверка выполнения требования гомоскедастичности случайных остатков может быть произведена визуально, на основе графика остатков, или с помощью специальных критериев.

Для проведения визуального анализа необходимо построить график зависимости величин случайных остатков от выровненного значения результирующей переменной. В случае гомоскедастичности "облако" случайных остатков находится в области, параллельной оси абсцисс (рис. 2.2, а). Все прочие случаи соответствуют гетероскедастичности случайных остатков (например, как на рис. 2.2, б). Аналогичные графики можно построить также для зависимости случайных остатков от значений конкретных независимых переменных, входящих в регрессию.

К тестам, позволяющим выявить наличие гетероскедастичности случайных остатков, относят тесты Гольдфельда – Квандта, Парка, Глейзера, Уайта, Бреуша – Пагана, ранговой корреляции Спирмена и т.д.

Тест Гольдфельда Квандта применяется, если случайные остатки предполагаются нормально распределенными величинами и объем наблюдений достаточно большой. Процедура проверки следующая.

  • 1. Все наблюдения упорядочивают по мере возрастания какой-либо независимой переменной, которая, как предполагается, оказывает влияние на изменение дисперсии случайных остатков.
  • 2. Упорядоченную совокупность делят на три группы, причем первая и последняя должны быть равного объема, с числом наблюдений, больших, чем число параметров модели регрессии. Пусть в первую и третью группы отобрано по к наблюдений.
  • 3. По первой и третьей группам находят параметры уравнений регрессии той же структуры, что и исходное уравнение регрессии, и остаточные суммы квадратов по каждой модели.
  • 4. Используя данные об остаточных суммах квадратов моделей первой и третьей групп, рассчитывают фактическое значение F-критерия Фишера по формуле

Рис. 2.2.

а – нет зависимости (гомоскедастичность); б – дисперсия остатков увеличивается с увеличением выровненного значения результата (один из случаев гетероскедастичности)

где – большая остаточная сумма квадратов; – меньшая остаточная сумма квадратов.

5. Сравнивают фактическое значение F-критерия с табличным, найденным для df l=df 2 = k-m- 1 степеней свободы. Если F-фактическое больше табличного, то гипотеза об отсутствии гетероскедастичности отклоняется.

Тесты Парка, Глейзера, Уайта и Бреуша – Пагана основываются на предположении, чт.д.сперсия случайных остатков представляет собой определенную функцию от некоторой независимой переменной (или переменных). Перед применением этих тестов по уравнению регрессии необходимо рассчитать случайные остатки е,.

Для теста Парка строят зависимость вида

(2.72)

где Χμ – і-e значение j-й независимой переменной, оказывающей влияние на дисперсию остатков; vf – случайный остаток.

По тесту Глейзера находят параметры целой серии уравнений, задаваемых функцией

(2.73)

где к – какое-либо число, например к – -1; -0,5; 0,5; 1 и т.п.

Тест Уайта заключается в построении квадратичной функции, включающей все независимые переменные, входящие в исходную модель, а также их попарные произведения. Включение попарных произведений независимых переменных является необязательным, их можно опустить. Для случая с двумя переменными эта функция будет иметь вид

где α, γ – неизвестные параметры.

Тест Бреуша Пагана предполагает исследование влияния на дисперсию остатков нескольких независимых переменных, которые включают в регрессию вида

где – i-е значения_/-й, (j + 1)-й,...(/ + к)-й независимых переменных, оказывающих влияние на дисперсию остатков; – оценка дисперсии случайных остатков, рассчитанная по формуле

Остатки считаются гетероскедастичными, если параметр а. в функциях по тесту Парка (2.72) или тесту Глейзера (2.73) значим (для теста Глейзера – хотя бы при одном значении к). При проверке по тесту Уайта говорят, что остатки гетероскедастичны, если вся функция (2.74) значима noF-критерию Фишера.

Проверка гетероскедастичности по тесту Бреуша – Пагана заключается в расчете по функции (2.75) факторной суммы квадратов

которое сравнивается с табличным (число степеней свободы равно df = к + 1, т.е. числу независимых переменных в модели (2.75); уровень значимости равен а. Нулевая гипотеза о гомоскедастичности случайных остатков отвергается, если

Тест ранговой корреляции Спирмена, так же как и ранее рассмотренные тесты, основывается на предположении о зависимости (прямой или обратной) величины дисперсии случайных остатков от значений какой-либо независимой переменной. Для проведения проверки по этому тесту значения случайных остатков, взятые по модулю, и значения этой переменной ранжируют (например, по возрастанию), а затем находят коэффициент корреляции рангов Спирмена

где dj – разность между рангами і-го случайного остатка и і-го значения независимой переменной.

Полученное значение коэффициента корреляции проверяют на значимость, рассчитывая фактическое значение t-критерия Стьюдента (2.76) и сравнивая его с табличным значением при числе степеней свободы df=n- 2.

Если фактическое значение критерия больше табличного, то гипотеза о гомоскедастичности остатков отклоняется.

Проверим на гетероскедастичность модель регрессии из нашего примера:

Рассчитаем случайные остатки е для этой модели (табл. 2.5).

Таблица 2.5. Расчет случайных остатков для модели регрессии поступления налогов от количества занятых, объема отгрузки в обрабатывающих производствах и производства энергии

График зависимости случайных остатков от выровненного значения зависимой переменной имеет вид, представленный на рис. 2.3. Можно отметить определенное увеличение разброса точек в центральной части графика и уменьшение разброса для последних нескольких точек. Такая картина может свидетельствовать о наличии гетероскедастичности остатков.

Применим для анализа дисперсии остатков рассмотренные выше тесты. Так как большинство тестов основано на гипотезе, что известна переменная, вызывающая гетероскедастичность остатков, обратимся сначала к тесту Уайта, в котором рассматриваются все независимые переменные, входящие в модель регрессии.

Используем короткую форму теста Уайта, без включения попарных произведений независимых переменных. Получим следующий результат:

Рис. 2.3.

Табличное значение F-критерия равно 2,33 (а = 0,05; d/j = = 6; d/2 = 41). Таким образом, по тесту Уайта нет оснований отвергнуть нулевую гипотезу о гомоскедастичности остатков. Отметим также, что все параметры незначимы, но наибольшее значение ί-критерия (и достаточно близкое к табличному) имеют параметры при переменной х3 (табличное значение t-критерия составило 2,02 (а = 0,05; d/ = 41)). Таким образом, переменная х3 может быть рассмотрена в других тестах как возможная причина гетероскедастичности.

Тест Бреуша – Пагана позволяет рассматривать различные комбинации переменных в качестве объясняющих гетероскедастичность остатков. Уравнение теста, включающее в себя все три независимые переменные, будет иметь вид

Табличное значение критерия χ2 равно 7,82 (а = 0,05; df = = 3), таким образом, нет оснований отвергнуть нулевую гипотезу о гомоскедастичности случайных остатков. Руководствуясь предположениями, сделанными в ходе анализа теста Уайта, проведем тест Бреуша – Пагана применительно только к переменной х3. Получим следующие результаты:

Табличное значение критерия χ2 в данном случае равно 3,84 = 0,05; df= 1), таким образом, мы отвергаем нулевую гипотезу о гомоскедастичности случайных остатков. Остатки гетероскедастичны по переменной х3. Анализ по тесту Бреуша – Пагана при необходимости можно продолжить, исследуя влияние на дисперсию случайных остатков других независимых переменных. Опираясь на выявленное влияние на дисперсию остатков переменной х3, проверим эту связь с помощью других тестов.

Использование критерия Гольдфельда – Квандта предполагает упорядочивание данных, в нашем случае по переменной х3.

Общий объем наблюдений составляет 48 регионов, т.е. их можно разделить на три равные группы по 16 наблюдений в каждой или по 18 наблюдений в первой и третьей группах и 12 наблюдений во второй. Так как критерий Гольдфельда – Квандта предполагает построение уравнений регрессии той же структуры, что и исходное уравнение, остановимся на втором варианте деления совокупности как обеспечивающим большую достоверность регрессионного анализа (18 наблюдений на три коэффициента регрессии, т.е. по шесть наблюдений на каждый коэффициент).

Для первой и третьей совокупностей наблюдений найдем параметры уравнений множественной регрессии вида и рассчитаем случайные остатки по каждому из них. Получим следующие результаты.

Первая группа (минимальные значения х3):

Третья группа (максимальные значения х3):

Разделим большую остаточную сумму квадратов (по третьей группе) на меньшую (по первой группе): = 18,58. Табличное значение F-критерия равно 2,48 при df t = df 2= = 18 – 4 = 14 степенях свободы и уровне значимости 0,05. Следовательно, дисперсия остатков зависит от величины значений переменной х3, гипотеза о гомоскедастичности остатков отвергается.

Расчеты по тестам Парка и Глейзера по переменной х3 приводят к следующим результатам.

Тест Парка:

Тест Глейзера:

Табличное значение критерия Стьюдента равно 2,0129 (а = 0,05; df = 46). Таким образом, по тесту Глейзера при k = 1 и 0,5 гипотеза о гомоскедастичности остатков отвергается, по тесту Парка – нет оснований отвергнуть нулевую гипотезу.

Оценка гетероскедастичности остатков по переменной х3 с использованием коэффициента ранговой корреляции Спирмена привела к следующему результату:

То есть коэффициент ранговой корреляции незначим (табличное значение критерия Стьюдента, так же как в тестах Глейзера и Парка, равно 2,0129), нет оснований отвергнуть нулевую гипотезу о гомоскедастичности остатков.

Подводя итоги выявления гетероскедастичности в нашем примере, отметим, что по ряду тестов (Бреуша – Пагана, Гольдфельда – Квандта, Глейзера) гипотеза о гомоскедастичности остатков была отвергнута, т.е. можно утверждать, что на дисперсию случайных остатков оказывает влияние переменная х3. То, что гетероскедастичность была выявлена не во всех тестах, связано с тем, что разные тесты опираются на разные предпосылки о форме связи величины случайных остатков и независимой переменной. Исследование по тесту Глейзера показывает, что эта форма может быть описана выражением σ ε = Дх3), где / – линейная функция.

Причинами гетероскедастичности случайных остатков могут быть неверная функциональная форма уравнения регрессии (неверная спецификация модели), неоднородность исследуемой совокупности. Соответственно способами устранения гетероскедастичности являются построение модели иной функциональной формы и(или) разбиение совокупности на однородные группы. Если по каким-то причинам это сделать невозможно или нежелательно, т.д.я нахождения параметров уравнения регрессии можно воспользоваться обобщенным методом наименьших квадратов.

В соответствии с одной из предпосылок МНК нужно, чтобы дисперсия остатков была гомоскедастичной. Это означает, что для каждого значения фактора X остатки е, имеют одну и ту же дисперсию. Если это условие не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно продемонстрировать на поле корреляции (см. рис.).

Гомоскедастичность остатков означает, что дисперсия остатков одна и та же для каждого значения X. Используя трехмерное изображение, можно получить следующие графики, которые проиллюстрируют гомо- и гетероскедастичность


Рисунок с гомоскедастичностью показывает, что для каждого значения Х, распределения остатков одинаково в отличие от гетероскедастичности.

Для множественной регрессии вид графиков является наиболее наглядным способом изучения гомо- и гетероскедастичности.

Наличие гетероскедастичности может в ряде случаях привести к смещенности оценок коэффициентов регрессии, хотя несмещенность оценок коэффициентов регрессии, как правило, зависит от соблюдения второй предпосылки МНК, т. е. независимости остатков и величин факторов. Гетероскедастичность будет сказываться на уменьшении эффективности оценок b. В ча-стности, становится затруднительным использование формулы стандартной ошибки коэффициента регрессии Sb, которая предполагает единую дисперсию остатков для любых значений фактора.

Определение гетероскедастичности

При малом объеме выборки, что характерно для большинства , для оценки гетероскедастичости используют метод Гольдфельда - Квандта, который был разботан в 1965 г. Гольдфельдом и Квандтом, где они рассмотрели однофакторную линейную модель, для которой дисперсия остатков возрастает пропорционально квадрату фактора. Чтобы оценить нарушение гомоскедастичности, они предложили выполнить следующие операции.

  1. Упорядочить наблюдения по мере возрастания фактора Х.
  2. Исключить из рассмотрения С центральных наблюдений, причем (n - С): 2 > р, где р - число оцениваемых параметров.
  3. Разделить совокупность из (n - С) наблюдений на две группы (с малыми и большими значениями фактора X).
  4. Определить остаточную сумму квадратов для первой (S1) и второй (S2) групп и нахождение отношения: R = S1: S2.

При выполнении нулевой гипотезы о гомоскедастичности отношение R будет удовлетворять критерию Фишера с (n - С - 2p) : 2 степенями свободы для каждой остаточной суммы квадратов. Чем больше величина R превышает табличное значение F-критерия, тем в большей степени нарушена предпосылка о равенстве дисперсий остаточных величин.

*графический

Прежде всего, проверяется случайный характер остатков еi (1ая предпосылка мнк). С этой целью строится график зависимости остатков еi от теоретических расчетных значений уi. Если на графике нет направленности в расположении точек остатков еi, то остатки представляют собой случайные величины, МНК оправдан, теоретические значения расчетного уi хорошо аппроксимируют значения фактического yi.

Для обеспечения несмещенности оценок коэффициента регрессии, полученного МНК, необходимо выполнение условий независимости случайных остатков еi и переменных хi (2ая предпосылка мнк). С этой целью строится график зависимости случайных остатков ei от факторов хi, включенных в регрессию. На графике поверяется отсутствие направленности в расположении ei.

*Тест ранговой корреляции Спирмена

При использовании данного теста предполагается, что дисперсия отклонения будет либо увеличиваться, либо уменьшаться с увеличением значения X. Поэтому для регрессии построенной по МНК абсолютные величины отклонений и значения будут коррелированы. Значения и ранжируются (упорядочиваются по величинам). Затем определяется коэффициент ранговой корреляции:

где - разность между рангами значений и ().

Если tрасч> tтабл, гипотеза о равенстве 0 коэф-та корел-ии отклоняется, отсутствие гетероскедастичности. В противном случае нулевая гипотеза принимается.

*Тест Голдфелда–Квандта. Этот тест применяется в том случае, если ошибки регрессии можно считать нормально распределенными случайными величинами.

Предположим, что средние квадратические (стандартные) отклонения возмущений о, пропорциональны значениям объясняющей переменной X (это означает постоянство часто встречающегося на практике относительного (а не абсолютного, как в классической модели) разброса возмущений е, регрессионной модели.

Упорядочим n наблюдений в порядке возрастания значений регрессора X и выберем т первых и т последних наблюдений.

В этом случае гипотеза о гомоскедастичности будет равносильна тому, что значения е 1 ,..., е т и е п-т+ 1,..., е n (т.е. остатки е i регрессии первых и последних т наблюдений) представляют собой выборочные наблюдения нормально распределенных случайных величин, имеющих одинаковые дисперсии.

Гипотеза о равенстве дисперсий двух нормально распределенных совокупностей, как известно (см., например, ), проверяется с помощью критерия Фишера–Снедекора.

Нулевая гипотеза о равенстве дисперсий двух наборов по т наблюдений (т.е. гипотеза об отсутствии гетероскедастичности) отвергается, если

где р – число регрессоров.

Заметим, что числитель и знаменатель в выражении (7.19)следовало разделить на соответствующее число степеней свободы, но в данном случае эти числа одинаковы и равны (т – р).


Мощность теста, т.е. вероятность отвергнуть гипотезу об отсутствии гетероскедастичности, когда действительно гетероскедастичности нет, оказывается максимальной, если выбирать т порядка n /3.

При применении теста Голдфелда–Квандта на компьютере нет необходимости вычислять значение статистики F вручную, так как величины представляют собой суммы квадратов остатков регрессии, осуществленных по “урезанным” выборкам.

ОМНК

Наиболее существенным достижением эконометрики является значительное развитие самих методов оценивания неизвестных параметров и усовершенствование критериев выявления статической значимости рассматриваемых эффектов. В этом плане невозможность или нецелесообразность использования традиционного МНК по причине проявляющейся в той или иной степени гетероскедастичности привели к разработке обобщенного метода наименьших квадратов (ОМНК).

Фактически при этом корректируется модель, изменяются ее спецификации, преобразуются исходные данные для обеспечения несмещенности, эффективности и состоятельности оценок коэффициентов регрессии.

Предполагается, что среднее остатков равно нулю, но их дисперсия уже не является постоянной, а пропорциональна величинам Кi, где эти величины представляют собой коэффициенты пропорциональности, различные для различных значений фактора х. Таким образом, именно эти коэффициенты (величины Кi) характеризуют неоднородность дисперсии. Естественно, считается, что сама величина дисперсии, входящая общим множителем при этих коэффициентах пропорциональности, неизвестна.

Исходная модель после введения этих коэффициентов в уравнение множественной регрессии продолжает оставаться гетероскедастичной (точнее говоря, таковыми являются остаточные величины модели). Пусть эти остаточные величины (остатки) не являются автокоррелированными. Введем новые переменные, получающиеся делением исходных переменных модели, зафиксированных в результате i-наблюдения, на корень квадратный из коэффициентов пропорциональности Кi. Тогда получим новое уравнение в преобразованных переменных, в котором уже остатки будут гомоскедастичны. Сами новые переменные - это взвешенные старые (исходные) переменные.

Поэтому оценка параметров полученного таким образом нового уравнения с гомоскедастичными остатками будет сводиться к взвешенному МНК (по существу это и есть ОМНК). При использовании вместо самих переменных регрессии их отклонения от средних выражения для коэффициентов регрессии приобретают простой и стандартизованный (единообразный) вид, незначительно различающийся для МНК и ОМНК поправочным множителем 1/К в числителе и знаменателе дроби, дающей коэффициент регрессии.

Следует иметь в виду, что параметры преобразованной (скорректированной) модели существенно зависят от того, какая концепция положена за основу для коэффициентов пропорциональности Кi. Часто считают, что остатки просто пропорциональны значениям фактора. Наиболее простой вид модель принимает в случае, когда принимается гипотеза о том, что ошибки пропорциональны значениям последнего по порядку фактора. Тогда ОМНК позволяет повысить вес наблюдений с меньшими значениями преобразованных переменных при определении параметров регрессии по сравнению с работой стандартного МНК с первоначальными исходными переменными. Но эти новые переменные уже получают иное экономическое содержание.

Гипотеза о пропорциональности остатков величине фактора вполне может иметь под собой реальное обоснование. Пусть обрабатывается некая недостаточно однородная совокупность данных, например, включающая крупные и мелкие предприятия одновременно. Тогда большим объемным значениям фактора может соответствовать и большая дисперсия результативного признака, и большая дисперсия остаточных величин. Далее, использование ОМНК и соответствующий переход к относительным величинам не просто снижают вариацию фактора, но и уменьшают дисперсию ошибки. Тем самым реализуется наиболее простой случай учета и коррекции гетероскедастичности в регрессионных моделях посредством применения ОМНК.

Изложенный выше подход к реализации ОМНК в виде взвешенного МНК является достаточно практичным - он просто реализуется и имеет прозрачную экономическую интерпретацию. Конечно, это не самый общий подход, и в контексте математической статистики, служащей теоретической основой эконометрики, нам предлагается значительно более строгий метод, реализующий ОМНК в самом общем виде. В нем необходимо знать ковариационную матрицу вектора ошибок (столбца остатков). А это в практических ситуациях, как правило, несправедливо, и отыскать эту матрицу как таковую бывает невозможно. Поэтому приходится каким-то образом оценивать искомую матрицу, чтобы использовать вместо самой матрицы такую оценку в соответствующих формулах. Таким образом, описанный вариант реализации ОМНК представляет одну из таких оценок. Иногда его называют доступный обобщенный МНК.

Лекция 5. Гетероскедастичность и автокорреляция регрессионных остатков

Литература:

    Эконометрика: учебник / И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др.; под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2006.

    Бородич С.А. Эконометрика: учебное пособие. – Минск: ООО «Новое знание», 2005 – 408с.

    Еремеева Н.С., Лебедева Т.В. Эконометрика: учебн. Пособие для вузов. – Оренбург: ОАО «ИПК «Южный Урал», 2010. – 296 с.

    Кремер Н.Ш. Эконометрика: учебник (Н.Ш. Кремер, Б.А. Путко). – М.: ЮНИТИ-ДАНА, 2006 – 311с.

1. Гетероскедастичность. Тесты на гетероскедастичность

2. Автокорреляция регрессионных остатков. Методы выявления

3. Обобщенный метод наименьших квадратов для смягчения гетероскедастичности и устранения автокорреляции

Для получения качественных оценок параметров уравнения регрессии необходимо следить за выполнимостью предпосылок МНК. Применяя МНК мы предполагаем, что остатки ε i подчиняются условиям Гаусса-Маркова, данное предположение необходимо проверить, после построения уравнения регрессии.

1. Гетероскедастичность. Тесты на гетероскедастичность

Допущение о постоянстве дисперсии остатков известно какдопущение о гомоскедастичности. Если это допущение нарушено и дисперсия остатков не является постоянной, то говорят, что оценки гетероскедастичны.

На практике, для каждого i-го наблюдения определяется единственное значение ε i , но мы говорим об определении дисперсии остатков, т.е. о множестве ε i для каждого i-го наблюдения. Это объясняется тем, что мы имеем дело с выборочной совокупностью, а априори ε i могли принимать любые значения на основе некоторых вероятностных распределений.

Гетероскедастичность приводит к тому, что коэффициенты регрессии не являются оценками с минимальной дисперсией, следовательно, они больше не являются наиболее эффективными коэффициентами. Вследствие, выводы, получаемые на основе t и F-статистик, а также интервальные оценки будут ненадежными. Дисперсии и, следовательно, стандартные ошибки этих коэффициентов будут смещенными. Если смещение отрицательно, то оценочные стандартные ошибки будут меньше, чем они должны быть, а критерий проверки - больше чем в реальности. Таким образом, можно сделать вывод, что коэффициент значим, когда он таковым не является. И наоборот если смещение положительно, то оценочные ошибки будут больше чем они должны быть, а критерии проверки - меньше. Значит, возможно ошибочное принятие нулевой гипотезы.

Обнаружение гетероскедастичности

Существует несколько формальных тестов, позволяющих обнаружить гетероскедастичность (графический анализ остатков, тест ранговой корреляции Спирмена, тест Парка, тест Голфелда-Квандта, тест Уайта).

Графический анализ остатков

Использование графического представления отклонений позволяет определиться с наличием гетероскедастичности. В этом случае по оси абсцисс откладываются значения x i объясняющей переменной X (либо линейной комбинации объясняющих переменных

а по оси ординат либо отклонения ε i либо их квадраты , i = 1, 2, ..., п . Если все отклонения находятся внутри полуполосы постоянной ширины, параллельной оси абсцисс, это говорит о независимости дисперсий от значений переменной X и их постоянстве, т.е. в этом случае выполняются условия гомоскедастичности. Графический анализ отклонений является удобным и достаточно надежным в случае парной регрессии.

Обычно не ограничиваются визуальной проверкой гетероскедастичности, а проводят ее эмпирическое подтверждение.