Способы устранения мультиколлинеарности. Отбор наиболее существенных факторов.


  

      Единого метода устранения мультиколлинеарности, годного в любом случае, не существует. Это связано с тем, что причины и последствия мультиколлинеарности неоднозначны и во многом зависят от результатов выборки. Все методы, которые могут быть использованы, делятся на две категории: к первой относятся попытки повысить степень выполнения условий Гаусса-Маркова, ко второй – использование внешней информации.

1. Так как проблема практически всегда возникает в регрессиях по временным рядам, то можно увеличить число наблюдений (от ежегодных к поквартальным). Однако надо не забывать об усилении автокорреляции и ошибок измерения.

2. При перекрестных данных можно увеличить дисперсию наблюдений независимых переменных в выборке.

3. Отбор наиболее существенных факторов. Можно использовать процедуры пошагового включения или исключения факторов. Например, процедура пошагового отбора состоит в следующем:

а) строят уравнение регрессии с полным набором факторов;

б) определяют матрицы парных и частных  коэффициентов корреляции;

в) отбирают фактор с наименьшей (отбор) или наибольшей (включение) величиной коэффициента частной корреляции по t-критерию: , r – должен быть существенным для включения и несущественным для исключения;

г) строят новое уравнение регрессии:

- при отсеве – пока все факторы не будут существенно отличны от нуля;

- при включении – пока увеличивается .

4. Переход от несмещенных оценок к смещенным, т.е.

           , где - некоторое положительное число (=0,10,4). Таким образом,  - невырожденная, увеличивается определитель, и уменьшаются ошибки параметров.

5. Переход от исходных объясняющих переменных к новым, представляющим линейные комбинации исходных. В качестве таких переменных используют, например, главные компоненты вектора исходных объясняющих переменных (Метод главных компонент).

 

 Пример использования пошагового отбора факторов в модель.

         Изучается зависимость индекса человеческого развития у от переменных:

Х1 – ВВП 1997 г., % к 1992 г.;

Х2 – расходы на конечное потребление в текущих ценах, % к ВВП;

Х3 – расходы домашних хозяйств, % к ВВП;

Х4 – валовое накопление, % к ВВП;

Х5 – суточная калорийность питания населения, ккал на душу населениея;

Х6 – ожидаемая продолжительность жизни при рождении в 1997 г., число лет.

Страна 

Y

x1

x2

x3

x4

x5

x6

x1

x5

x2

Австрия

0,904

115

75,5

56,1

25,2

3343

77

115

3343

75,5

Австралия

0,922

123

78,5

61,8

21,8

3001

78,2

123

3001

78,5

Белоруссия

0,763

74

78,4

59,1

25,7

3101

68

74

3101

78,4

Бельгия

0,923

111

77,7

63,3

17,8

3543

77,2

111

3543

77,7

Великобритания

0,918

113

84,4

64,1

15,9

3237

77,2

113

3237

84,4

Германия

0,906

110

75,9

57

22,4

3330

77,2

110

3330

75,9

Дания

0,905

119

76

50,7

20,6

3808

75,7

119

3808

76

Индия

0,545

146

67,5

57,1

25,2

2415

62,6

146

2415

67,5

Испания

0,894

113

78,2

62

20,7

3295

78

113

3295

78,2

Италия

0,9

108

78,1

61,8

17,5

3504

78,2

108

3504

78,1

Канада

0,932

113

78,6

58,6

19,7

3056

79

113

3056

78,6

Казахстан

0,74

71

84

71,7

18,5

3007

67,6

71

3007

84

Китай

0,701

210

59,2

48

42,4

2844

69,8

210

2844

59,2

Латвия

0,744

94

90,2

63,9

23

2861

68,4

94

2861

90,2

Нидерланды

0,921

118

72,8

59,1

20,2

3259

77,9

118

3259

72,8

Норвегия

0,927

130

67,7

47,5

25,2

3350

78,1

130

3350

67,7

Польша

0,802

127

82,6

65,3

22,4

3344

72,5

127

3344

82,6

Россия

0,747

61

74,4

53,2

22,7

2704

66,6

61

2704

74,4

США

0,927

117

83,3

67,9

18,1

3642

76,7

117

3642

83,3

Украина

0,721

46

83,7

61,7

20,1

2753

68,8

46

2753

83,7

Финляндия

0,913

107

73,8

52,9

17,3

2916

76,8

107

2916

73,8

Франция

0,918

110

79,2

59,9

16,8

3551

78,1

110

3551

79,2

Чехия

0,833