Обнаружение автокорреляции.


В силу неизвестности значений параметров регрессии неизвестными будут также и истинные значения отклонений , поэтому выводы об их независимости осуществляются на основе оценок  , полученных из эмпирического уравнения регрессии. Рассмотрим возможные методы определения автокорреляции.

Графический метод. Существует несколько вариантов графического определения автокорреляции. Один из них состоит в анализе последовательно-временных графиков. По оси абсцисс откладывают время, либо порядковый номер наблюдения, а по оси ординат – отклонения  (Рис. 1).

Рис. 1.

Естественно предположить, что на рис. 1, а - г имеются определенные связи между отклонениями, т.е. автокорреляция имеет место. Отсутствие зависимости на рис. 1, д скорее всего свидетельствует об отсутствии автокорреляции.

Например, на рис. 1, б отклонения вначале в основном отрицательные, затем положительные, потом снова отрицательные. Это свидетельствует о наличии между отклонениями определенной зависимости. Более того, можно утверждать, что в этом случае имеет место положительная автокорреляция остатков. Она становится весьма наглядной, если график 1, б дополнить графиком зависимости  от  (рис. 2).

 

 

Рис. 2

Подавляющее большинство точек на этом графике расположено в I и III четвертях декартовой системы координат, подтверждая положительную зависимость между соседними отклонениями.

Современные ППП решение задач построения регрессии дополняют графическим представлением результатов: график реальных колебаний зависимой переменной накладывается на график колебаний переменной по уравнению регрессии. Сопоставление этих графиков часто дает возможность выдвинуть гипотезу о наличии автокорреляции.

Метод рядов. Последовательно определяются знаки отклонений . Например,

(-----)(+++++++)(---)(++++)(-), т.е. 5 «-», 7 «+», 3 «-», 4 «+», 1 «-» при 20 наблюдениях.

Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называют длиной ряда. Визуальное распределение знаков свидетельствует о неслучайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений n, то вполне вероятна положительная автокорреляция. Если рядов слишком много, то вероятна отрицательная автокорреляция. Пусть n – объем выборки, n1 и n2 – общее количество, соответственно, знаков «+» и «-», k – количество рядов.

При  достаточно  большом количестве наблюдений  (n1 > 10,

n2 > 10) и отсутствии автокорреляции случайная величина k имеет асимптотически нормальное распределение с

         ;         .

Тогда, если , то гипотеза об отсутствии автокорреляции не отклоняется.

Число  определяется по таблице функции стандартного нормального распределения из равенства F() = . Например, при , =1,96 и при , =2,58.

Для небольшого числа наблюдений (n1 < 20, n2 < 20) разработаны таблицы критических значений количества рядов при n наблюдениях. Суть таблиц в следующем.

На пересечении строки n1 и столбца n2 определяются нижнее k1 и верхнее k2 значения при уровне значимости  (Рис.3).

                    автокорреляция > 0          автокорреляция = 0                  автокорреляция < 0

  ______kk1_________k1<k<k2_________kk2____________

                              k1                              k2

Рис.3.

Пример 1. Пусть изучается зависимость среднедушевых расходов на конечное потребление y от среднедушевого дохода х по данным некоторой страны за 16 лет.

Исходные  (и расчетные  для примера 3) данные (усл.ед.) представлены в следующей таблице:

1

70

73

0,18

-

-

2

73

76

0,76

37,51

38,99

3

78

83

0,12

40,99

44,47

4

83

89

0,28

43,45

46,92

5

86

95

-1,55

43,92

49,88

6

89

100

-2,58

45,4

51,83

7

96

107

-1,22

50,88

56,3

8

96

108

-2,03

47,33

53,75

9

103

113

0,94

54,33

58,24

10

109

119

2,1

56,78

61,71

11

112

121

3,49

56,74

60,66

12

114

122

4,69

57,22

60,65

13

115

131

-1,56

57,2

69,14

14

118

135

-1,79

59,7

68,58

15

122

139

-1,01

62,17

70,55

16

123

140

-0,82

61,15

69,53

 

Пусть исходная модель имеет вид: .

По исходным данным с использованием МНК получено следующее оцененное уравнение регрессии:

 


ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,993402

R-квадрат

0,986847

Нормированный R-квадрат

0,985908

Стандартная ошибка

2,108545

Наблюдения

16

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

4670,194

4670,194

1050,435

1,43E-14

Остаток

14

62,24347

4,445962

Итого

15

4732,438

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

10,987

2,771947

3,963639

0,001413

5,041761

16,93223

x

0,805944

0,024867

32,41042

1,43E-14

0,75261

0,859278

 

График остатков свидетельствует о наличии автокорреляции.

 


,  

(в скобках указаны стандартные ошибки).

Используя метод рядов, получим: n = 16,  (++++)(----)(++++)(----),  n1 = 8 < 20, n2 = 8 < 20, k = 4.  По таблицам (Приложение 1) k1 =4, k2 =14. Т.к. kk1, то принимается предположение о наличии положительной автокорреляции (Рис. 3). 

 

Критерий Дарбина-Уотсона.

Оценкой коэффициента корреляции  является коэффициент автокорреляции остатков первого порядка, который при достаточно большом числе наблюдений имеет вид:

.

Считается, что , .

Выдвигается нулевая гипотеза об отсутствии корреляции первого порядка,  т.е. . В качестве альтернативной гипотезы может выступать либо , либо .

Для проверки нулевой гипотезы используют статистику Дарбина-Уотсона, рассчитываемую по формуле:

.

Если автокорреляция остатков отсутствует , то .

При положительной автокорреляции  имеем , а при отрицательной  - соответственно, .

По таблице определяются критические значения критерия Дарбина-Уотсона  и  для заданного числа наблюдений, числа объясняющих переменных  и уровня значимости. По этим значениям отрезок  разбивается на 5 зон (рис.4). В зависимости от того, в какую зону попадает расчетное значение критерия, принимают или отвергают  соответствующую гипотезу.

Зона неопределенности

Зона неопределенности

 

 0

     

      4-            4-

     4

Рис. 4

 

Наличие зоны неопределенности связано с тем, что распределение  DW- статистики зависит не только от числа наблюдений и числа объясняющих переменных, но и от значений объясняющих переменных.

Пример 2. Пусть оценена парная регрессия (пример 1). Рассчитаем DW – статистику: DW= 0,991. Зададим уровень значимости 5% и найдем по таблице (Приложение 2) =1,106 и =1,371. Поскольку , то нулевая гипотеза отклоняется и принимается гипотеза  о положительной автокорреляции остатков (Рис. 4).

Замечание. Тест Дарбина-Уотсона разработан в предположении, что объясняющие переменные некоррелированы со случайным членом.

 

Предыдущие материалы: Следующие материалы: