Проверка статистических гипотез, доверительные интервалы.


Проверка значимости коэффициентов регрессии.

    Как и в случае парной регрессии можно показать, что вектор оценок  имеет нормальное распределение со средним  и матрицей ковариаций , т е.

                                                    .

Таким образом, случайные величины 

 и  имеют распределение Стьюдента с (n-р-1) степенями свободы. В общем случае проверяются гипотезы:  Н0: а = а0    или о значимости     Н0: а = 0

Н0: b = b0                                       Н0: b = 0

Проверка состоит  в следующем:

- если , то нет оснований отвергать Н0 (р- число факторов);

- если , то Н0 отвергают.

     Соответствующие доверительные интервалы для оценок коэффициентов регрессии ():   ()    и    ().

Пример. , k = n – p1 = 7-2-1 = 4, tkp(0,05;4) = 2,78.

     1)  H0: ,    Н0 отвергается и  

          значим при 5 - % -ом уровне значимости.

          Доверительный интервал: (0,698; 1,748).

2)      H0: ,   Н0 принимается и

     не значим.

Доверительные интервалы.

     Наряду с интервальным оцениванием коэффициентов регрессии весьма важным для оценки точности определения зависимой переменной является построение доверительного интервала для функции регрессии или условного математического ожидания зависимой переменной Мх(y). Обобщая соответствующие выражения на случай множественной регрессии, можно получить доверительный интервал:

,

, - стандартная ошибка,  .

Доверительный интервал для индивидуальных значений зависимой переменной yi примет вид:  ,   .

Доверительный интервал для параметра  во множественной регрессии строится аналогично парной модели:    .

Пример. Известно: S2 = 0,4175;  S = 0,64614;

 ;    .

 По данным примера оценить сменную добычу угля на одного рабочего для шахт с мощностью пласта 10 м и уровнем механизации 6,5 %. Найти 95 % -й доверительный интервал для индивидуального и среднего значений и интервальную оценку дисперсии при .

1) (т).

2)      ,     ,

          =.

           .

                      

3)   .

            .

4)  ;

          ;

;

.

 

Оценка надежности результатов множественной регрессии и корреляции.

Для определения статистической значимости R2 проверяется гипотеза

                    Н0: R2 = 0 с помощью статистики F =   .

Если F < Fкр(), то Н0 нет оснований отвергать или R2 статистически не значим,  не значимо и уравнение в целом. В противном случае – уравнение и R2  значимы.

Пример. .  Fkp (0,05;2;4) = 6,94.

Т.к. F > Fkp, то уравнение значимо.

     Оценивается не только значимость уравнения в целом, но и значимость фактора, дополнительно включенного в модель. Мерой оценки включения фактора в модель служит частный F- критерий, Fxi.

     Если оценивается значимость влияния фактора хр после включения в модель факторов х1, х2,…,хр-1, то формула частного F- критерия примет вид:

                              .

В общем виде для xi  .

С помощью частного F- критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор вводится в уравнение последним. Зная Fxi можно определить t-критерий: . Взаимосвязь частного коэффициента корреляции, частного F-критерия и t-критерия для коэффициентов чистой регрессии можно использовать в процедуре отбора факторов (на каждом шаге исключается фактор с наименьшим незначимым значением Fxi или tbi).

Предыдущие материалы: Следующие материалы: