Качество уравнения регрессии. Коэффициент детерминации.


     Цель регрессионного анализа состоит в объяснении поведения зависимой переменной. Пусть для этого по выборочным данным построено уравнение регрессии. Тогда значение у в каждом наблюдении можно разложить на две составляющие , где е – остаток, т.е. та часть, которую невозможно объяснить. Разброс значений зависимой переменной характеризуется выборочной дисперсией

D(y) = D () = D () + D (e) + 2cov (, e).

Cov (, e) = cov (                               

              D(y)        =           D()        +        D(e)

      общая дисперсия       факторная дисперсия,              остаточная дисперсия,   

                                           объясненная уравнением          необъясненная

Коэффициентом детерминации R2 называют отношение   ,

характеризующее долю вариации зависимой переменной, объясненную уравнением регрессии, .

Если R2 = 1, то  D(y) = D(), D(e) = 0, т.е. все точки наблюдений лежат на регрессионной прямой.

 Если R2 = 0, то регрессия не дает ничего, линия регрессии параллельна оси Ох.

Чем ближе R2  к 1, тем более точно  аппроксимирует у.

 Вычисление R2 корректно, если  включено в уравнение. Полезны следующие соотношения:

;             .

Для определения статистической значимости R2 проверяется гипотеза

                    Н0: R2 = 0 с помощью статистики F =   .

Если F < Fкр(, то Н0 нет оснований отвергать или R2 статистически не значим, в противном случае – значим. В случае парной регрессии R2 = r2. Коэффициент корреляции r выступает показателем тесноты линейной зависимости, тесная нелинейная связь возможна и при r , близких к нулю.

     Для нашего примера:

, R2 = 0,982.

Следовательно, уравнение регрессии описывает 98,2% дисперсии признака у. Это означает очень тесную зависимость.

     Можно показать, что в парном регрессионном анализе эквивалентны t-критерий для Н0: b = 0, t-критерий для Н0: r = 0 и F-критерий для Н0: R2 = 0. Таким образом, проверка значимости коэффициента b равносильна проверке значимости уравнения регрессии

             ,    ,   F =   и   tb =  tr =  .

 

Предыдущие материалы: Следующие материалы: