Частная корреляция.


     В случае парной регрессии естественной мерой зависимости (линейной) является выборочный коэффициент корреляции между переменными. Использование многомерной регрессии позволяет обобщить это понятие на случай, когда имеется несколько независимых переменных. Корректировка здесь необходима по следующим соображениям: высокое значение коэффициента корреляции между исследуемой зависимой и какой-либо независимой переменной может означать высокую степень зависимости, но может быть обусловлено и другой причиной. Имеется третья переменная, которая оказывает сильное влияние на две первые, что и является причиной высокой корреляции.

     Поэтому возникает естественная задача найти «чистую» корреляцию между двумя переменными, исключив (линейное) влияние других факторов. Это можно сделать с помощью коэффициента частной корреляции.

     Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет дополнительного включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.

     Пусть , - соответствующие остаточные дисперсии регрессий Y на X1 и Y на X1, X2. Влияние фактора X2 на результат можно определить коэффициентом частной корреляции

,       .

     Можно получить другую формулу коэффициента частной корреляции:

 ,                  

Или   ,           .

     Рассмотренные показатели частной корреляции называют коэффициентами частной корреляции 1-го порядка, так как они фиксируют тесноту связи двух переменных при закреплении (элиминировании) влияния одного фактора. Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. Коэффициенты парной корреляции называют коэффициентами нулевого порядка. Если рассматривается регрессия с числом факторов р, то возможны частные коэффициенты корреляции 1-го, 2-го, …, (р-1)-го порядков, т.е. влияние, например, х1 можно оценить при разных условиях независимости действия других факторов: , , .  Сопоставление коэффициентов частной корреляции разного порядка по мере увеличения числа включаемых факторов показывает процесс «очищения» зависимости результативного признака с исследуемым фактором.

     Выборочным частным коэффициентом корреляции между переменными xi и xj при фиксированных значениях остальных (р-2) переменных называют выражение

,

где - алгебраические дополнения элементов  матрицы выборочных коэффициентов корреляции. Коэффициенты частной корреляции более высоких порядков можно определить через коэффициенты частной корреляции более низких порядков по рекуррентной формуле:

.

В частности, при трех факторах возможно вычисление трех коэффициентов частной корреляции 2-го порядка: , , , например,

.

Например. Составим матрицу Q парных коэффициентов корреляции, частные коэффициенты корреляции.

; ; ; ; det(Q)=0,04823; q11 = 1-0,4972 = 0,75299;

R = ..

; ; .

Сравнивая частные коэффициенты корреляции с соответствующими парными коэффициентами, видим, что за счет «очищения» связи наибольшему изменению подвергся коэффициент корреляции между х1 и х2: был 0,497 – стал -0,185. Это пример ложной корреляции, так как х1 – мощность пласта не может зависеть от х2 – уровня механизации. А коэффициенты корреляции между у и х1, у и х2 после «очищения» несколько снизились от 0,963 до 0,952 и от 0,599 до 0,344, что по-видимому, соответствует действительности.

     Зная частные коэффициенты корреляции, можно определить совокупный коэффициент корреляции по формуле:

.

Предыдущие материалы: Следующие материалы: