Причины и последствия мультиколлинеарности. Обнаружение.


Мультиколлинеарность – это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии. Она может быть функциональной (явной) и стохастической (скрытой). При функциональной мультиколлинеарности  матрица ХТХ– вырождена и, (ХТХ)-1 не существует, поэтому невозможно определить . Чаще мультиколлинеарность проявляется в стохастической форме, при этом МНК – оценки формально существуют, но обладают рядом недостатков:

1) небольшое изменение исходных данных приводит к существенному изменению оценок регрессии;

2) оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой (высокое значение R2);

3) расширяются интервальные оценки коэффициентов, ухудшая их точность;

4) возможно получение неверного знака у коэффициента регрессии.

Обнаружение.    

Существует несколько признаков, по которым может быть установлено наличие мультиколлинеарности.

     Во-первых, анализ корреляционной матрицы парных коэффициентов корреляции:

                             

   - если имеются пары переменных, имеющих высокие коэффициенты корреляции (> 0,75 – 0,8), говорят о мультиколлинеарности между ними;

   - если факторы некоррелированы, то det Q = 1, если полная корреляция, то det Q = 0.

Можно проверить Н0: det Q = 1; используя статистический критерий      , где n – число наблюдений, m = р+1.

Если , то Н0 отвергается, и мультиколлинеарность доказана.

Во-вторых, определяют множественные коэффициенты детерминации одной из объясняющих переменных и некоторой группой других.  Наличие высокого R2 (> 0,6) свидетельствует о мультиколлинеарности.

В третьих, близость к нулю  - минимального собственного значения матрицы ХТХ (т.е. решения уравнения ) свидетельствует о близости к нулю и det(XTX) и, следовательно, о мультиколлинеарности.

В-четвертых, высокие частные коэффициенты корреляции.

, где - алгебраические дополнения элементов  матрицы выборочных коэффициентов корреляции. Коэффициенты частной корреляции более высоких порядков можно определить через коэффициенты частной корреляции более низких порядков по рекуррентной формуле:

.

      В-пятых, о присутствии мультиколлинеарности говорят некоторые внешние признаки построенной модели, являющиеся её следствиями. К ним следует отнести такие:

  • некоторые из оценок имеют неправильные с точки зрения экономической теории знаки или неоправданно большие по абсолютной величине значения;
  • небольшое изменение исходных статистических данных (добавление или изъятие некоторых наблюдений) приводит к существенному изменению оценок коэффициентов модели, вплоть до изменения их знаков;
  • большинство или даже все оценки коэффициентов регрессии оказываются статистически незначимыми по t-критерию, в то время как модель в целом является значимой по F-критерию.

Существует и ряд других методов определения мультиколлинеарности.

     Если основная задача модели – прогноз будущих значений зависимой переменной, то при достаточно большом коэффициенте детерминации R2 (> 0,9) наличие мультиколлинеарности обычно не сказывается на прогнозных качествах модели. Это утверждение будет обоснованным, если и в будущем между коррелированными переменными сохранятся те же соотношения.

     Если целью исследования является определение степени влияния каждой из объясняющих переменных на зависимую переменную, то наличие мультиколлинеарности, приводящее к увеличению стандартных ошибок, скорее всего, исказит истинные зависимости между переменными. В этой ситуации мультиколлинеарность является серьезной проблемой.

 

Предыдущие материалы: Следующие материалы: