Обнаружение гетероскедастичности.


Не существует какого-либо однозначного метода определения гетероскедастичности. При этом разработано большое число различных тестов и критериев. Рассмотрим  наиболее популярные из них.

3.1. Тест ранговой корреляции Спирмена. Выдвигается Ho об отсутствии гетероскедастичности случайного члена. Предполагается, что дисперсия случайного члена будет либо увеличиваться, либо уменьшаться по мере увеличения Х, и поэтому в регрессии по МНК абсолютные величины остатков  и значения Х будут коррелированны. Схема теста:

1) данные по Х и остатки  ранжируются по Х и определяются их ранги;

2)  коэффициент ранговой корреляции Спирмена определяется по  формуле

          , где Di  - разность между рангами Х и ;

3)  Статистический критерий имеет распределение Стьюдента, т.к.     .

Если , H0 об отсутствии гетероскедастичности будет отклонена.

Если в модели регрессии имеется более одной объясняющей переменной, то проверка гипотезы может выполняться с использованием любой из них.

 

Пример. Исследуется зависимость между доходом (Х) домохозяйства и его расходом (Y) на продукты питания. Выборочные данные по 40 домохозяйствам даны в таблице.

x

25,5

26,5

27,2

29,6

35,7

38,6

39

39,3

40

41,9

y

14,5

11,3

14,7

10,2

13,5

9,9

12,4

8,6

10,3

13,9

 

x

42,5

44,2

44,8

45,5

45,5

48,3

49,5

52,3

55,7

59

y

14,9

11,6

21,5

10,8

13,8

16

18,2

19,1

16,3

17,5

 

x

61

61,7

62,5

64,7

69,7

71,2

73,8

74,7

75,8

76,9

y

10,9

16,1

10,5

10,6

29

8,2

14,3

21,8

26,1

20

 

x

79,2

81,5

82,4

82,8

83

85,9

86,4

86,9

88,3

89

y

19,8

21,2

29

17,3

23,5

22

18,3

13,7

14,5

27,3

 

Решение

1. Строим уравнение регрессии и определяем остатки.

 

 

 

 

 

 


ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,564649

R-квадрат

0,318828

Нормированный R-квадрат

0,300903

Стандартная ошибка

4,672041

Наблюдения

40

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

388,2371

388,2371

17,786

0,0001

Остаток

38

829,4627

21,82796

Итого

39

1217,7

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

7,040019

2,322793

3,030842

0,0044

2,3378

11,742

2,3378

11,74

х

0,156883

0,037199

4,217372

0,0001

0,0816

0,2322

0,0816

0,232

 

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное у

Остатки

1

11,04054

3,459461

2

11,19742

0,102578

3

11,30724

3,39276

4

11,68376

-1,48376

5

12,64075

0,859253

6

13,09571

-3,19571

7

13,15846

-0,75846

8

13,20553

-4,60553

9

13,31534

-3,01534

10

13,61342

0,286578

11

13,70755

1,192448

12

13,97425

-2,37425

13

14,06838

7,431617

14

14,1782

-3,3782

15

14,1782

-0,3782

16

14,61747

1,382526

17

14,80573

3,394266

18

15,24501

3,854994

19

15,77841

0,521591

20

16,29612

1,203877

21

16,60989

-5,70989

22

16,71971

-0,61971

23

16,84521

-6,34521

24

17,19036

-6,59036