Введение

1. Суть и причины автокорреляции

2. Обнаружение автокорреляции

3. Последствия автокорреляции

4. Методы устранения

4.1 Определение

на основе статистики Дарбина-Уотсона

Заключение

Список использованной литературы

Введение

Модели, построенные по данным, характеризующим один объект за ряд последовательных моментов (периодов), называются моделями временных рядов. Временной ряд – это совокупность значений какого-либо показателя за несколько последовательных моментов или периодов. Применение традиционных методов корреляционно-регрессионного анализа для изучения причинно-следственных зависимостей переменных, представленных в форме временных рядов, может привести к ряду серьезных проблем, возникающих как на этапе построения, так и на этапе анализа эконометрических моделей. В первую очередь эти проблемы связаны со спецификой временных рядов как источника данных в эконометрическом моделировании.

Предполагается, что в общем случае каждый уровень временного ряда содержит три основные компоненты: тенденцию (Т), циклические или сезонные колебания (S) и случайную компоненту (E). Если временные ряды содержат сезонные или циклические колебания, то перед проведением дальнейшего исследования взаимосвязи необходимо устранить сезонную или циклическую компоненту из уровней каждого ряда, поскольку ее наличие приведет к завышению истинных показателей силы и связи изучаемых временных рядов в случае, если оба ряда содержат циклические колебания одинаковой периодичности, либо к занижению этих показателей в случае, если сезонные или циклические колебания содержит только один из рядов или периодичность колебаний в рассматриваемых временных рядах различна. Устранение сезонной компоненты из уровней временных рядов можно проводить в соответствии с методикой построения аддитивной и мультипликативной моделей. Если рассматриваемые временные ряды имеют тенденцию, коэффициент корреляции по абсолютной величине будет высоким, что в данном случае есть результат того, что х и у зависят от времени, или содержат тенденцию. Для того чтобы получить коэффициенты корреляции, характеризующие причинно-следственную связь между изучаемыми рядами, следует избавиться от так называемой ложной корреляции, вызванной наличием тенденции в каждом ряде. Влияние фактора времени будет выражено в корреляционной зависимости между значениями остатков

за текущий и предыдущие моменты времени, которая получила название «автокорреляция в остатках».

1.Суть и причины автокорреляции

Автокорреляция - это взаимосвязь последовательных элементов временного или пространственного ряда данных. В эконометрических исследованиях часто возникают и такие ситуации, когда дисперсия остатков постоянная, но наблюдается их ковариация. Это явление называют автокорреляцией остатков.

Автокорреляция остатков чаще всего наблюдается тогда, когда эконометрическая модель строится на основе временных рядов. Если существует корреляция между последовательными значениями некоторой независимой переменной, то будет наблюдаться и корреляция последовательных значений остатков. Автокорреляция может быть также следствием ошибочной спецификации эконометрической модели. Кроме того, наличие автокорреляции остатков может означать, что необходимо ввести в модель новую независимую переменную.

Автокорреляция в остатках есть нарушение одной из основных предпосылок МНК – предпосылки о случайности остатков, полученных по уравнению регрессии. Один из возможных путей решения этой проблемы состоит в применении к оценке параметров модели обобщенного МНК.

Среди основных причин, вызывающих появление автокорреляции, можно выделить ошибки спецификации, инерцию в изменении экономических показателей, эффект паутины, сглаживание данных.

Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводит к системным отклонениям точек наблюдений от линии регрессии, что может обусловить автокорреляцию.

Инерция. Многие экономические показатели (например, инфляция, безработица, ВНП и т.п.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Действительно, экономический подъем приводит к росту занятости, сокращению инфляции, увеличению ВНП и т.д. Этот рост продолжается до тех пор, пока изменение конъюктуры рынка и ряда экономических характеристик не приведет к замедлению роста, затем остановке и движению вспять рассматриваемых показателей. В любом случае эта трансформация происходит не мгновенно, а обладает определенной инертностью.

Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом). Например, предложение сельскохозяйственной продукции реагирует на изменение цены с запаздыванием (равным периоду созревания урожая). Большая цена сельскохозяйственной продукции в прошедшем году вызовет (скорее всего) ее перепроизводство в текущем году, а следовательно, цена на нее снизится и т.д.

Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его подынтервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может послужить причиной автокорреляции.

2.Обнаружение автокорреляции

В силу неизвестности значений параметров уравнения регрессии неизвестными будут также и истинные значения отклонений

,t=1,2…T. Поэтому выводы об их независимости осуществляются на основе оценок ,t=1,2…T, полученные из эмпирического уравнения регрессии. Рассмотрим возможные методы определения автокорреляции.

2.1.Графический метод

Существует несколько вариантов графического определения автокорреляции. Один из них, указывающий отклонения

с моментами t их получении (их порядковыми номерами i), приведен на рис. 2.1.Это так называемые последовательно-временные графики. В этом случае по оси абсцисс обычно откладывают либо время (момент) получения статистических данных, либо порядковый номер наблюдения, а по оси ординат- отклонения (либо оценки отклонений )
Рис.2.1.

Естественно предположить, что на рис 2.1. а-г имеются определенные связи между отклонениями, т.е. автокорреляция имеет место. Отсутствие зависимости на рис. д скорее всего свидетельствует об отсутствии автокорреляции.

Например, на рис. 2.1.б отклонения вначале в основном отрицательные, затем положительные, потом снова отрицательные. Это свидетельствует о наличии между отклонениями определенной зависимости.

2.2. Метод рядов

Этот метод достаточно прост: последовательно определяются знаки отклонений

,t=1,2…T. Например,

(-----)(+++++++)(---)(++++)(-),

Т.е. 5 «-», 7 «+», 3 «-», 4 «+», 1 «-» при 20 наблюдениях.

Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называется длиной ряда.

Визуальное распределение знаков свидетельствует о неслучайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений n, то вполне вероятна положительная автокорреляция. Если же рядов слишком много, то вероятна отрицательная автокорреляция.

2.3 Критерий Дарбина-Уотсона

Наиболее известным критерием обнаружения автокорреляции первого порядка является критерий Дарбина- Уотсона и расчет величины

(2.3.1)

Согласно (2.3.1) величина d есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии. Значение критерия Дарбина – Уотсона указывается наряду с коэффициентом детерминации, значениями t- и F- критериев.

Задание . Приведены данные за 15 лет по темпам прироста заработной платы Y(%), производительности труда X 1 (%), а также по уровню инфляции X 1 (%).
Постройте уравнение линейной регрессии прироста заработной платы от производительности труда и уровня инфляции. Проверьте качество построенного уравнения регрессии с надежностью 0,95. Проведите проверку наличия в модели автокорреляции на уровне значимости 0,05.

Решение находим с помощью калькулятора .
Уравнение множественной регрессии может быть представлено в виде:
Y = f(β , X) + ε
где X = X(X 1 , X 2 , ..., X m) - вектор независимых (объясняющих) переменных; β - вектор параметров (подлежащих определению); ε - случайная ошибка (отклонение); Y - зависимая (объясняемая) переменная.
теоретическое линейное уравнение множественной регрессии имеет вид:
Y = β 0 + β 1 X 1 + β 2 X 2 + ... + β m X m + ε
β 0 - свободный член, определяющий значение Y, в случае, когда все объясняющие переменные X j равны 0.

Прежде чем перейти к определению нахождения оценок коэффициентов регрессии, необходимо проверить ряд предпосылок МНК.
Предпосылки МНК.
1. Математическое ожидание случайного отклонения ε i равно 0 для всех наблюдений (M(ε i) = 0).
2. Гомоскедастичность (постоянство дисперсий отклонений). Дисперсия случайных отклонений ε i постоянна: D(ε i) = D(ε j) = S 2 для любых i и j.
3. отсутствие автокорреляции.
4. Случайное отклонение должно быть независимо от объясняющих переменных: Y eixi = 0.
5. Модель является линейное относительно параметров.
6. отсутствие мультиколлинеарности. Между объясняющими переменными отсутствует строгая (сильная) линейная зависимость.
7. Ошибки ε i имеют нормальное распределение. Выполнимость данной предпосылки важна для проверки статистических гипотез и построения доверительных интервалов.

Эмпирическое уравнение множественной регрессии представим в виде:
Y = b 0 + b 1 X 1 + b 1 X 1 + ... + b m X m + e
Здесь b 0 , b 1 , ..., b m - оценки теоретических значений β 0 , β 1 , β 2 , ..., β m коэффициентов регрессии (эмпирические коэффициенты регрессии); e - оценка отклонения ε.
При выполнении предпосылок МНК относительно ошибок ε i , оценки b 0 , b 1 , ..., b m параметров β 0 , β 1 , β 2 , ..., β m множественной линейной регрессии по МНК являются несмещенными, эффективными и состоятельными (т.е. BLUE-оценками).

Для оценки параметров уравнения множественной регрессии применяют МНК.
1. Оценка уравнения регрессии .
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения:
s = (X T X) -1 X T Y
Матрица X

1 3.5 4.5
1 2.8 3
1 6.3 3.1
1 4.5 3.8
1 3.1 3.8
1 1.5 1.1
1 7.6 2.3
1 6.7 3.6
1 4.2 7.5
1 2.7 8
1 4.5 3.9
1 3.5 4.7
1 5 6.1
1 2.3 6.9
1 2.8 3.5

Матрица Y

9
6
8.9
9
7.1
3.2
6.5
9.1
14.6
11.9
9.2
8.8
12
12.5
5.7

Матрица X T

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
3.5 2.8 6.3 4.5 3.1 1.5 7.6 6.7 4.2 2.7 4.5 3.5 5 2.3 2.8
4.5 3 3.1 3.8 3.8 1.1 2.3 3.6 7.5 8 3.9 4.7 6.1 6.9 3.5

Умножаем матрицы, (X T X)


Находим обратную матрицу (X T X) -1
0.99 -0.12 -0.1
-0.12 0.0246 0.00393
-0.1 0.00393 0.0194

Вектор оценок коэффициентов регрессии равен
s = (X T X) -1 X T Y =

y(x) =
0,99 -0,12 -0,1
-0,12 0,0246 0,00393
-0,1 0,00393 0,0194
*
133,5
552,41
659,84
=
0,27
0,53
1,48

Уравнение регрессии (оценка уравнения регрессии)
Y = 0.27 + 0.53X 1 + 1.48X 2
Проверка на наличие автокорреляции остатков .
Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями.
Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных.
В экономических задачах значительно чаще встречается положительная автокорреляция , нежели отрицательная автокорреляция . В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.
Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот. Такая ситуация может иметь место, если ту же зависимость между спросом на прохладительные напитки и доходами рассматривать по сезонным данным (зима-лето).
Среди основных причин, вызывающих автокорреляцию , можно выделить следующие:
1. Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводят к системным отклонениям точек наблюдения от линии регрессии, что может обусловить автокорреляцию.
2. Инерция. Многие экономические показатели (инфляция, безработица, ВНП и т.д.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Поэтому изменение показателей происходит не мгновенно, а обладает определенной инертностью.
3. Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом).
4. Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его интервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может служить причиной автокорреляции.
Последствия автокорреляции схожи с последствиями гетероскедастичности : выводы по t- и F-статистикам, определяющие значимость коэффициента регрессии и коэффициента детерминации, возможно, будут неверными.
Обнаружение автокорреляции
1. Графический метод
Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения ε i с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения ε i (либо оценки отклонений).
Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии автокорреляции.
Автокорреляция становится более наглядной, если построить график зависимости ε i от ε i-1
2. Коэффициент автокорреляции .

Если коэффициент автокорреляции r ei 3. Критерий Дарбина-Уотсона .
Этот критерий является наиболее известным для обнаружения автокорреляции.
При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин e i .

y y(x) e i = y-y(x) e 2 (e i - e i-1) 2
9 8.77 0.23 0.053 0
6 6.18 -0.18 0.0332 0.17
8.9 8.17 0.73 0.53 0.83
9 8.26 0.74 0.55 0.000109
7.1 7.52 -0.42 0.18 1.35
3.2 2.69 0.51 0.26 0.88
6.5 7.67 -1.17 1.37 2.83
9.1 9.12 -0.0203 0.000412 1.32
14.6 13.58 1.02 1.05 1.09
11.9 13.53 -1.63 2.65 7.03
9.2 8.41 0.79 0.63 5.86
8.8 9.07 -0.27 0.0706 1.12
12 11.93 0.0739 0.00546 0.12
12.5 11.69 0.81 0.66 0.54
5.7 6.92 -1.22 1.49 4.13
9.53 27.27

Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона :

DW = 27.27/9.53 = 2.86
Критические значения d 1 и d 2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 15 и количества объясняющих переменных m=1.
Автокорреляция отсутствует, если выполняется следующее условие:
d 1 Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 2.5, то автокорреляция остатков присутствует .
Для более надежного вывода целесообразно обращаться к табличным значениям.
По таблице Дарбина-Уотсона для n=15 и k=1 (уровень значимости 5%) находим: d 1 = 1.08; d 2 = 1.36.
Поскольку 1.08 присутствует.

Мультиколлинеарность

Одним из условий классической линейной регрессионной модели является предположение о линейной независимости объясняющих переменных, что означает линейную независимость столбцов матрицы или (эквивалентно), что матрица не вырождена. При нарушении этого условия, т.е. когда один из столбцов матрицы есть линейная комбинация остальных столбцов, говорят, что имеет место полная коллинеарность. В этой ситуации нельзя построить МНК-оценку вектора параметров , поскольку .

На практике полная коллинеарность встречается исключительно редко. Гораздо чаще приходится сталкиваться с ситуацией, когда матрица имеет полный ранг, но между регрессорами имеется высокая степень корреляции, что приводит к тому, что матрица близка к вырожденной. Тогда говорят о наличии мультиколлинеарности. В этом случае МНК-оценка существует, но обладает «плохими» свойствами.

Мультиколлинеарность может возникнуть в силу разных причин. Например, несколько независимых переменных могут иметь общий временной тренд, относительно которого они совершают малые колебания.

Признаки мультиколлинеарности:

1) Небольшое изменение исходных данных (например, добавление новых наблюдений) приводит к существенному изменению оценок коэффициентов регрессии.

2) Оценки имеют большие стандартные ошибки (и, следовательно, большие доверительные интервалы), малую значимость (т.е. малые t -статистики ) в то время как модель в целом является значимой (т.е. высокое значение коэффициента детерминации и соответствующей F -статистики )

3) Оценки коэффициентов имеют неоправданные с точки зрения теории знаки или неоправданно большие значения.

4) Парная корреляция между малозначимыми объясняющими переменными достаточно высока.

5) Высокие частные коэффициенты корреляции.

Напомним, что выборочный коэффициент (парной) корреляции между переменными и находится по формуле:

(1)

Выборочный частный коэффициент корреляции находится следующим образом.

Пусть даны переменные , .

Обозначим .

Пусть , .

Построим регрессии и на :

(2)

(3)

Найдем остатки для этих регрессий:

Частный коэффициент корреляции между и без учета влияния переменных – это коэффициент парной корреляции между остатками и :

Таким образом, коэффициент частной корреляции позволяет исключить влияние других факторов на взаимосвязь между рассматриваемыми переменными.

Например, равен коэффициенту парной корреляции между остатками и следующих регрессий:

(6)

(7)

Последствия мультиколлинеарности

1) Большие стандартные ошибки затрудняют нахождение истинных значений определяемых величин и расширяют их интервальные оценки, ухудшая их точность.



2) Ухудшается качество прогноза.

3) Малые t -статистики коэффициентов могут привести к неоправданному выводу о их малой значимости, т.е. о слабом влиянии соответствующей объясняющей переменной на зависимую переменную.

4) Оценки коэффициентов и их стандартные ошибки становятся очень чувствительными к малейшим изменениям данных, т.е. они становятся неустойчивыми.

Методы устранения мультиколлинеарности

1) Исключение переменных из модели. Исключается из модели одна или несколько коррелированных объясняющих переменных. Например, можно последовательно исключать из модели объясняющие переменные с наименьшими незначащими t -статистиками коэффициентов регрессии (причем после каждого исключения из модели объясняющей переменной следует производить пересчет t -статистик для оставшихся объясняющих переменных).

2) Можно использовать описанный в предыдущей теме алгоритм оптимального отбора объясняющих переменных, основанный на использовании скорректированного коэффициента детерминации .

3) Получение дополнительных данных или новой выборки

4) Изменение спецификации модели

5) Преобразование переменных.

Например, вместо переменной можно включить в модель переменную .

Гетероскедастичность и автокорреляция остатков

Гетероскедастичность означает, что дисперсии случайных отклонений зависят от , т.е. нарушается гипотеза классической модели о постоянстве этих дисперсий.

Автокорреляция остатков означает, что ковариации не равны нулю при разных значениях и .

Суть и причины гетероскедастичности

Гетероскедастичность означает, что зависит от номера наблюдения . Обычно эта зависимость возникает вследствие зависимости от . Например, если – уровень дохода семьи, а – ее потребление, естественно ожидать что для семей с высоким доходом разброс в их потреблении больше, чем для семей с низким доходом.

Проблема гетероскедастичности характерна для перекрестных данных и довольно редко встречается при рассмотрении временных рядов.

Последствия гетероскедастичности

1) Оценки коэффициентов регрессии, оставаясь линейными и несмещенными, перестают быть эффективными, что (в частности) ухудшает прогноз.

2) Дисперсии и ковариации оценок являются смещенными. Это приводит к искажению значений статистик Стъюдента и Фишера, что негативным образом сказывается на результаты проверки гипотез и построении интервальных оценок.

Обнаружение гетероскедастичности

Графический анализ остатков.

По оси абсцисс откладываются либо номера наблюдений , либо значения объясняющей переменной , либо линейная комбинация объясняющих переменных, либо прогнозные значения объясняемой переменной. По оси ординат – либо отклонения , либо их квадраты . При наличии гетероскедастичности можно визуально заметить зависимость значений от .

Тест Уайта (White)

Сначала к исходной модели применяется обычный метод наименьших квадратов и находятся остатки регрессии , . Затем осуществляется регрессия квадратов этих остатков на все регрессоры исходной модели, их квадраты , попарные произведения и константу (если ее не было в составе исходных регрессоров). Для этой регрессии находится коэффициент детерминации . Тогда при выполнении нулевой гипотезы о постоянстве дисперсий случайных отклонений величина:

асимптотически (т.е. при большом количестве наблюдений ) имеет распределение , где – число регрессоров второй регрессии.

Напомним, что распределение «хи квадрат» с степенями свободы – это распределение следующей случайной величины:

где – независимые стандартные нормальные случайные величины.

Следовательно, при выполнении нулевой гипотезы имеет место равенство:

где – -квантиль распределения «хи квадрат» с степенями свободы.

В случае, если нулевая гипотеза отвергается (и, следовательно, можно сделать вывод о наличии гетероскедастичности); если , нет оснований отвергать нулевую гипотезу (и, она принимается).

Тест ранговой корреляции Спирмана

Этот тест применяется, когда есть предположение о прямой зависимости дисперсии ошибки от величины некоторой независимой переменной. Значения такой независимой переменной и абсолютные величины отклонений ранжируются (упорядочиваются по величинам). Затем определяется коэффициент ранговой корреляции:

, (11)

где – разность между рангами и . (Например, если при значение является 25-м по величине среди всех наблюдений , а является 32-м, то .)

Доказано, что если коэффициент корреляции равен нулю, то статистика:

(12)

имеет распределение Стъюдента с числом степеней свободы . Следовательно, если

(13)

(где двусторонняя квантиль распределения Стъюдента с степенями свободы при уровне значимости ), то нулевая гипотеза о равенстве нулю коэффициента корреляции отклоняется, и, следовательно, можно сделать вывод о присутствии гетероскедастичности.

Тест Голфельда-Куандта (Goldfeld-Quandt)

Этот тест также применяется, когда есть предположение о прямой зависимости дисперсии ошибки от величины некоторой независимой переменной.

1) упорядочить данные по убыванию той независимой переменной, относительно которой есть подозрение на гетероскедастичность;

2) исключить средних (в этом упорядочении) наблюдений ( должно быть примерно равно четверти общего количества наблюдений);

3) провести две независимые регрессии первых наблюдений и последних наблюдений и построить соответствующие остатки и ;

4) составить статистику .

Если верна нулевая гипотеза (8) о постоянстве дисперсий случайных отклонений, то построенная статистика имеет распределение Фишера с степенями свободы.

В случае, если нулевая гипотеза отвергается и, следовательно, можно сделать вывод о присутствии гетероскедастичности; если , нет оснований отвергать нулевую гипотезу.

Суть и причины автокорреляции

Автокорреляция остатков (отклонений) в подавляющем большинстве случаев встречается в регрессионном анализе при использовании данных временных рядов. В экономических задачах значительно чаще встречается положительная автокорреляция (т.е. когда ), нежели отрицательная.


В силу неизвестности значений параметров регрессии неизвестными будут также и истинные значения отклонений , поэтому выводы об их независимости осуществляются на основе оценок , полученных из эмпирического уравнения регрессии. Рассмотрим возможные методы определения автокорреляции.

Графический метод . Существует несколько вариантов графического определения автокорреляции. Один из них состоит в анализе последовательно-временных графиков. По оси абсцисс откладывают время, либо порядковый номер наблюдения, а по оси ординат – отклонения (Рис. 1).

Естественно предположить, что на рис. 1, а - г имеются определенные связи между отклонениями, т.е. автокорреляция имеет место. Отсутствие зависимости на рис. 1, д скорее всего свидетельствует об отсутствии автокорреляции.

Например, на рис. 1, б отклонения вначале в основном отрицательные, затем положительные, потом снова отрицательные. Это свидетельствует о наличии между отклонениями определенной зависимости. Более того, можно утверждать, что в этом случае имеет место положительная автокорреляция остатков. Она становится весьма наглядной, если график 1, б дополнить графиком зависимости от (рис. 2).

Подавляющее большинство точек на этом графике расположено в I и III четвертях декартовой системы координат, подтверждая положительную зависимость между соседними отклонениями.

Современные ППП решение задач построения регрессии дополняют графическим представлением результатов: график реальных колебаний зависимой переменной накладывается на график колебаний переменной по уравнению регрессии. Сопоставление этих графиков часто дает возможность выдвинуть гипотезу о наличии автокорреляции.

Метод рядов . Последовательно определяются знаки отклонений . Например,

(-----)(+++++++)(---)(++++)(-), т.е. 5 «-», 7 «+», 3 «-», 4 «+», 1 «-» при 20 наблюдениях.

Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называют длиной ряда. Визуальное распределение знаков свидетельствует о неслучайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений n, то вполне вероятна положительная автокорреляция. Если рядов слишком много, то вероятна отрицательная автокорреляция. Пусть n – объем выборки, n1 и n2 – общее количество, соответственно, знаков «+» и «-», k – количество рядов.

При достаточно большом количестве наблюдений (n1 > 10,

n2 > 10) и отсутствии автокорреляции случайная величина k имеет асимптотически нормальное распределение с

; .

Тогда, если , то гипотеза об отсутствии автокорреляции не отклоняется.

Число определяется по таблице функции стандартного нормального распределения из равенства F() = . Например, при , =1,96 и при , =2,58.

Для небольшого числа наблюдений (n1 < 20, n2 < 20) разработаны таблицы критических значений количества рядов при n наблюдениях. Суть таблиц в следующем.

На пересечении строки n1 и столбца n2 определяются нижнее k1 и верхнее k2 значения при уровне значимости (Рис.3).

автокорреляция > 0 автокорреляция = 0 автокорреляция < 0

Kk1_________k1

Пример 1. Пусть изучается зависимость среднедушевых расходов на конечное потребление y от среднедушевого дохода х по данным некоторой страны за 16 лет.

Исходные (и расчетные для примера 3) данные (усл.ед.) представлены в следующей таблице:

Пусть исходная модель имеет вид: .

По исходным данным с использованием МНК получено следующее оцененное уравнение регрессии:


ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

R-квадрат

Нормированный R-квадрат

Стандартная ошибка

Наблюдения

Дисперсионный анализ

Значимость F

Регрессия




Определение автокорреляции Автокорреляция (последовательная корреляция) – это корреляция между наблюдаемыми показателями во времени (временные ряды) или в пространстве (перекрестные данные). Автокорреляция остатков характеризуется тем, что не выполняется предпосылка 3 0 использования МНК:




Причины чистой автокорреляции 1. Инерция. Трансформация, изменение многих экономических показателей обладает инерционностью. 2. Эффект паутины. Многие экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом) 3. Сглаживание данных. Усреднение данных по некоторому продолжительному интервалу времени.














Пример влияния автокорреляции на случайную выборку Рассмотрим выборку из 50 независимых нормально распределенных с нулевым средним значений i. С целью ознакомления с влиянием автокорреляции будем вводить в нее положительную, а затем отрицательную автокорреляцию.















Dependent Variable: LGHOUS Method: Least Squares Sample: Included observations: 45 ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ АВТОКОРРЕЛЯЦИЯ ПРИМЕР Зависимость расходов на жилье от располагаемого дохода и индекса цен на жилье











Последствия автокорреляции 1. Истинная автокорреляция не приводит к смещению оценок регрессии, но оценки перестают быть эффективными. 2. Автокорреляция (особенно положительная) часто приводит к уменьшению стандартных ошибок коэффициентов, что влечет за собой увеличение t-статистик. 3. Оценка дисперсии остатков S e 2 является смещенной оценкой истинного значения e 2, во многих случаях занижая его. 4. В силу вышесказанного выводы по оценке качества коэффициентов и модели в целом, возможно, будут неверными. Это приводит к ухудшению прогнозных качеств модели.






Автокорреляционная функция AutocorrelationPartial CorrelationAC PAC Q-Stat Prob. |*******. |******* |******|. |. | |******|. |. | |***** |. |. | |***** |. |. | |**** |. |. | |**** |. |. | |*** |. |. | |*** |. |. | |*** |. |. | |** |. |. | |** |. |. | |*. |. |. | |*. |. |. | |. |. |. | |. |. |. | |. |. |. | *|. |. |. | *|. |. |. | *|. |. |. |



Dependent Variable: LGHOUS Method: Least Squares Sample: Included observations: 45 ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ 3 Расходы на жилье в зависимости от доходов и реальных цен












14 Противоположный эффект в 1960 to Расходы на жилье в зависимости от доходов и реальных цен


Критерий знаков Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Приписать каждому остатку знак (+/-) 3.Построить ряд знаков При истинности гипотезы ряд должен носить случайный характер распределения 4.Подсчитать общее количество серий (последовательностей постоянного знака) - (n) 5.Подсчитать длину самой длинной серии - (n) 6.Сравнить полученные значения с критическими


Критерий знаков Проверяемая гипотеза: H0: автокорреляция отсутствует Приблизительный критерий проверки гипотезы на уровне значимости 2,5% 5,0% : При истинности гипотезы должна выполняться система неравенств: подробности см. в учебнике Айвазян, Мхитарян «Прикладная статистика и основы эконометрики»


Критерий восходящих и нисходящих серий Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить разницу между соседними остатками, t =e t+1 -e t 3.Приписать каждой разнице у знак (+/-) 4.Построить ряд знаков При отсутствии автокорреляции ряд должен носить случайный характер 5.Подсчитать общее количество серий (последовательностей постоянного знака) - (n) 6.Подсчитать длину самой длинной серии - (n) 7.Сравнить полученные значения с критическими






Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить следующие статистики: 3.Сравнить полученные значения (n) с критическим – при нулевой гипотезе (n)> * При n> * При n>60 кр"> * При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> * При n>60 кр" title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить следующие статистики: 3.Сравнить полученные значения (n) с критическим – при нулевой гипотезе (n)> * При n>60 кр"> title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить следующие статистики: 3.Сравнить полученные значения (n) с критическим – при нулевой гипотезе (n)> * При n>60 кр">


60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):" title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):" class="link_thumb"> 56 Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона): 60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> 60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> 60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):" title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):">




Тест Дарбина-Уотсона. Ограничения Ограничения: 1. Тест не предназначен для обнаружения других видов автокорреляции (более чем первого) и не обнаруживает ее. 2. В модели должен присутствовать свободный член. 3. Данные должны иметь одинаковую периодичность (недолжно быть пропусков в наблюдениях). 4. Тест не применим к авторегрессионным моделям, содержащих в качестве объясняющей переменной зависимую переменную с единичным лагом:






Критические точки распределения Дарбина-Уотсона Для более точного определения, какое значение DW свидетельствует об отсутствии автокорреляции, а какое – о ее наличии, построена таблица критических точек распределения Дарбина-Уотсона. По этой таблице для заданного уровня значимости, числа наблюдений n и количества объясняющих переменных m определяются два значения: d l – нижняя граница, d u – верхняя граница




Расположение критических точек распределения Дарбина-Уотсона При положительной корреляции: При отрицательной корреляции: При отсутствии корреляции: 24 0 dLdL dUdU d crit Положительная автокорреляция Отрицательная автокорреляция Отсутствие автокорреляции d crit 4-d L 4-d U






Dependent Variable: LGHOUS Method: Least Squares Sample: Included observations: 45 ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ Как и следовало ожидать- имеем положительную автокорреляцию остатков ТЕСТ ДАРБИНА-УОТСОНА ДЛЯ ПРОЦЕССА AR(1) dLdL dUdU (n = 45, k = 3, 1% level)




Устранение автокорреляции первого порядка. Обобщения Рассмотренное авторегрессионное преобразование может быть обобщено на: 1) Произвольное число объясняющих переменных 2) Преобразования более высоких порядков AR(2), AR(3) и т.д.: Однако на практике значения коэффициента автокорреляции обычно неизвестны и его необходимо оценить. Существует несколько методов оценивания.






Итеративная процедура Кохрейна-Оркатта (на примере парной регрессии) 1. Определение уравнения регрессии и вектора остатков: 2. В качестве приближенного значения берется его МНК-оценка: 3. Для найденного * оцениваются коэффициенты 0 1: 4. Подставляем в (*) и вычисляем Возвращаемся к этапу 2. Критерий остановки: разность между текущей и предыдущей оценками * стала меньще заданной точности.


Итеративная процедура Хилдрета-Лу (поиск по сетке) 1. Определение уравнения регрессии и вектора остатков: 2. Оцениваем регрессию для каждого возможного значения [ 1,1] с некоторым достаточно малым шагом, например 0,001; 0,01 и т.д. 3. Величина *, обеспечивающая минимум стандартной ошибки регрессии принимается в качестве оценки автокорреляции остатков.


Итеративные процедуры оценивания коэффициента. Выводы 1. Сходимость процедур достаточно хорошая. 2. Метод Кохрейна-Оркатта может «попасть» в локальный (а не глобальный) минимум. 3. Время работы процедуры Хилдрета-Лу значительно сокращается при наличии априорной информации об области возможных значений. Процедура Дарбина представляет собой традиционный МНК снелинейными ограничениями типа равенств: Способы решения: 1. Решать задачу нелинейного программирования. 2. Двухшаговый МНК Дарбина (полученный коэффициент автокорреляции используется в поправке Прайса-Винстена). 3. Итеративная процедура расчета. Процедура Дарбина (на примере парной регрессии)


Процедура Дарбина Ограничения на коэффициенты записываются в явном виде ============================================================ Dependent Variable: LGHOUS Method: Least Squares Sample(adjusted): LGHOUS=C(1)*(1-C(2))+C(2)*LGHOUS(-1)+C(3)*LGDPI-C(2)*C(3) *LGDPI(-1)+C(4)*LGPRHOUS-C(2)*C(4)*LGPRHOUS(-1) ============================================================ Coefficient Std. Error t-Statistic Prob. ============================================================ C(1) C(2) C(3) C(4) ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood Durbin-Watson stat ============================================================


Dependent Variable: LGHOUS Method: Least Squares Sample(adjusted): Included observations: 44 after adjusting endpoints Convergence achieved after 21 iterations ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS AR(1) ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ Либо в список регрессоров включается авторегриссионный член 1 порядка AR(1) Процедура Дарбина


Dependent Variable: LGHOUS LGHOUS=C(1)*(1-C(2))+C(2)*LGHOUS(-1)+C(3)*LGDPI-C(2)*C(3) *LGDPI(-1)+C(4)*LGPRHOUS-C(2)*C(4)*LGPRHOUS(-1) ============================================================ Coefficient Std. Error t-Statistic Prob. ============================================================ C(1) C(2) C(3) C(4) ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS AR(1) ============================================================ Процедура Дарбина


Итеративная процедура метода Дарбина 1. Считается регрессия и находятся остатки. 2. По остаткам находят оценку коэффициента автокорреляции остатков. 3. Оценка коэффициента автокорреляции используется для пересчета данных и цикл повторяется. Процесс останавливается, как только обеспечивается достаточная точность (результаты перестают существенно улучшаться).


Обобщенный метод наименьших квадратов. Замечания 1. Значимый коэффициент DW может указывать просто на ошибочную спецификацию. 2. Последствия автокорреляции остатков иногда бывают незначительными. 3. Качество оценок может снизиться из-за уменьшения числа степеней свободы (нужно оценивать дополнительный параметр). 4. Значительно возрастает трудоемкость расчетов. Не следует применять обобщенный МНК автоматически