Множественный корреляционный анализ


Как правило экономический процесс описывается числом показателей, более двух, т.е. вектором случайных величин:

 

X=(X1, X2….., Xj…., Xm)

 

j -  номер показателя (фактора)

 

2.4.1. Корреляционная матрица

 

Пусть совокупность {Xj} имеет совместный  нормальный закон распределения. Тогда, как и ранее, взаимосвязь между двумя показателями Xi и Xj можно описать коэффициентом парной линейной корреляции Tij. Множество всех возможных сочетаний{Tij }, i,j= образует квадратную корреляционную матрицу:

                                         (2.11)

 

Отметим важные свойства корреляционной матрицы

 

1). Все диагональные элементы этой матрицы равны единице:

 

daig K = Tji = 1

 

2). Корреляционная матрица – симметричная, т.е. ее элементы, симметричные относительно главной диагонали, равны друг другу:

Tij = Tji,

так как  произведение  в формуле (2.4) для Tij не зависит от порядка следования сомножителей.

 

2.4.2. Выборочный коэффициент множественной корреляции

 

Коэффициент множественной корреляции определяет тесноту связи одного показателя с совокупностью остальных (n-1) показателей при их одновременном действии:.

                                                                                                          (2.12)

Kjj – алгебраическое дополнение элемента Tjj матрицы К.

Коэффициент множественной корреляции изменяется от 0 до +1, т.е. всегда неотрицателен.

2.4.3. Частный коэффициент корреляции

Частный коэффициент корреляции служит количественной мерой связи случайных величин Xi и Xj при условии исключения влияния других случайных (m-2) величин, т.е. при их фиксации.

Выборочная оценка коэффициента частной корреляции определяется по формуле:

 

                                                                                                         (2.13)

 

где Kij, Kjj – алгебраическое дополнение  соответствующих элементов матрицы К.

Частный коэффициент корреляции так же, как и парный коэффициент линейной парной корреляции, изменяется от -1 до + 1, т.е. может быть отрицательным.

Гипотеза о значимости частного коэффициента корреляции проверяется так же, как и для парного коэффициента корреляции:

 

H0 : tr < tтаб(a; N-2)?

 

2.4.4. Коэффициент детерминации

 

Коэффициент детерминации равен квадрату множественного коэффициента корреляции и показывает: какую долю общей дисперсии исследуемого показателя Xj объясняет (формирует) вариация всех остальных (n-1) показателей X1,X2,…,Xn при их совместном действии:

 

                                                                                                             (2.14)

                                                                                                         

2.4.5. Оценка значимости множественного коэффициента детерминации

Используется F – статистика Фишера для R2:

 

                                                                                                  (2.15)

 

где,  m – число компонент вектора ; N – число опытов.

Проверяется нуль гипотеза:

H0 : F = 0;

если  то коэффициент множественной корреляции незначим (гипотеза Н0 принимается);

если  то R2 значим (гипотеза Н0 отвергается);

– n1– число степеней свободы для числителя; n2 – число степеней свободы для знаменателя (n1=m-1; n2=N-m) дроби (2.15).

 

2.4.6. Индекс корреляции при нелинейной связи двух случайных величин

 

Слово «индекс» здесь понимается в смысле «отношения» . Поэтому употребляется и другой термин для этой числовой меры: «корреляционное отношение».

Пусть две случайные величины X и Y связаны в среднем нелинейным функциональным уравнением вида:

                                                                                                                            (2.16)

Например:

                                                                       

 

Функция f(x) должна быть априори известна.

                                             (2.16)

 

Тогда выборочная оценка индекса корреляции равна :

 

                                                        (2.17)

 

Практическая формула для индекса корреляции :

 

                                                (2.18)

 

Здесь:

 – дисперсия остатков уравнения регрессии;

 – общая дисперсия как мера разброса наблюдений вокруг среднего.

Заметим, что при подстановке  и  под корень в уравнении (2.18) и условии (N-m)»(N-1) при больших N степени свободы  и их можно сократить, откуда следует упрощенная приближенная расчетная формула.

 

                                                                               (2.20)

 

Эта формула допускает наглядное толкование: чем сильнее стохастическая связь в уравнении (2.16), тем меньше доля дисперсии   по отношению  к общей дисперсии и больше индекса корреляции .

 

2.4.7. Индекс множественной корреляции

 

Пусть построено нелинейное уравнение множественной регрессии:

 

                                                                                                      (2.20)

 

Тогда использую простую формулу (2.20), можно получить индекс множественной корреляции

 

                                                                       (2.21)

 

Соответственно квадрат этого индекса даст множественный индекс детерминации в нелинейном случае.

 

 

Предыдущие материалы: Следующие материалы: