Проверка значимости результатов множественной регрессии.


Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:

Проверка значимости результатов множественной регрессии.

где Dфакт – факторная сумма квадратов на одну степень свободы;

      Dост – остаточная сумма квадратов на одну степень свободы;

     Проверка значимости результатов множественной регрессии. - коэффициент (индекс) множественной детерминации;

      m – число параметров при переменных x (в линейной регрессии совпадает с числом включенных в модель факторов);

      n – число наблюдений.

Оценка значимости уравнения множественной регрес­сии осуществляется путем проверки гипотезы: Проверка значимости результатов множественной регрессии. (гипотеза о незначимости уравнения регрессии).

По таблицам распределения Фишера находят критическое значение F-критерия Проверка значимости результатов множественной регрессии.. Для этого за­даются уровнем значимости Проверка значимости результатов множественной регрессии. (обычно его берут равным 0,05) и двумя числами степеней свободы Проверка значимости результатов множественной регрессии. и Проверка значимости результатов множественной регрессии..   Здесь m – число параметров модели.

Сравнивают фактическое значение F-критерия Проверка значимости результатов множественной регрессии. с табличным Проверка значимости результатов множественной регрессии..

Если Проверка значимости результатов множественной регрессии., то ги­потезу о незначимости уравнения регрессии не отвергают. Если Проверка значимости результатов множественной регрессии., то выдвинутую гипотезу отвер­гают и принимают альтернативную гипотезу о статистиче­ской значимости уравнения регрессии.

 

Частный F-критерий оценивает статистическую значимость присутствия каждого факторов в уравнении. Необходимость такой оценки вызвана тем, что не каждый фактор, вошедший в модель, может существенно увеличивать долю объясненной вариации  результативно признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель.

Частный F-критерий построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на однй степень свободы по регрессионной модели в целом. Предположим, что оцениваем значимость влияния Проверка значимости результатов множественной регрессии. как дополнительно включенного в модель фактора. В общем виде для фактора Проверка значимости результатов множественной регрессии. частный F-критерий определится как:

Проверка значимости результатов множественной регрессии.

гдеПроверка значимости результатов множественной регрессии.Проверка значимости результатов множественной регрессии.- коэффициент множественной детерминации для модели с полным набором факторов;

     Проверка значимости результатов множественной регрессии.- тот же показатель, но без включения в модель фактора Проверка значимости результатов множественной регрессии.

      n – число наблюдений;

      m  – число параметров в модели (без свободного члена) или число независимых переменных модели.

По таблицам распределения Фишера находят критическое значение F-критерия Проверка значимости результатов множественной регрессии.. Для этого за­даются уровнем значимости Проверка значимости результатов множественной регрессии. (обычно его берут равным 0,05) и двумя числами степеней свободы Проверка значимости результатов множественной регрессии. и Проверка значимости результатов множественной регрессии..   Здесь m – число параметров модели.

Сравнивают фактическое значение F-критерия Проверка значимости результатов множественной регрессии. с табличным Проверка значимости результатов множественной регрессии..

Если Fкр  меньше  табличного, то включение в модель данного фактора x1 после введения в нее  фактора x2 нецелесообразно, и наоборот.

Оценка значимости коэффициентов чистой регрессии с помощью t-критерия Стьюдента сводится к вычислению значения:

Проверка значимости результатов множественной регрессии.

где bi  - коэффициент чистой регрессии при факторе xi;

     Проверка значимости результатов множественной регрессии.- средняя квадратичная ошибка коэффициента регрессии bi.

 Она может быть определена по следующей формуле:

Проверка значимости результатов множественной регрессии.

где Проверка значимости результатов множественной регрессии.- среднее квадратическое отклонение для фактора y;

      Проверка значимости результатов множественной регрессии.- среднее квадратическое отклонения для фактора xi;

    Проверка значимости результатов множественной регрессии.- коэффициент детерминации для уравнения множественной регрессии;

    Проверка значимости результатов множественной регрессии.- коэффициент детерминации для зависимости фактора xi  со всеми другими факторами уравнения множественной регрессии;

      n-m-1 – число степеней свободы для остаточной суммы квадратов отклонений.

 

Далее находят табличное значение t-критерия Проверка значимости результатов множественной регрессии.. Для этого за­даются уровнем значимости Проверка значимости результатов множественной регрессии. (обычно его берут равным 0,05) и Проверка значимости результатов множественной регрессии..   Здесь m – число параметров модели.

Сравнивают фактическое значение t-критерия  с табличным Проверка значимости результатов множественной регрессии..

Если фактическое tbi  меньше  табличного, то коэффициент регрессии bi статистически незначим, и формируется преимущественно под влиянием случайных факторов; и наоборот.

Аналогично оценивается статистическая значимость индекса множественной корреляции:

Проверка значимости результатов множественной регрессии.  (k – число независимых переменных модели).

 

Адекватность регрессионной модели оценим опять же с помощью средней ошибки аппроксимации – среднее отклонение расчетных значений от фактических:

Проверка значимости результатов множественной регрессии.

Допустимый предел значений  Проверка значимости результатов множественной регрессии.  –  не более 8-10%.

Предыдущие материалы: Следующие материалы: