Построение множественных регрессионных моделей по типологическим группам.


Постановка задачи множественной регрессии. По имеющимся данным n наблюдений за совместным изменением n+1 параметра y и xj и ((yi, xj,i); j=1,2,...,p; i=1,2,...,n) необходимо определить аналитическую зависимость ŷ=f(x1,x2,...,xp), наилучшим образом описывающую данные наблюдений.

Как и в случае парной регрессии, построение уравнения множественной регрессии осуществляется в два этапа:

– спецификация модели;

– оценка параметров выбранной модели.

Спецификация модели включает в себя решение двух задач:

– отбор p факторов xj, наиболее влияющих на величину y;

– выбор вида уравнения регрессии ŷ=f (x1,x2,...,xp);.

Изучение связи между результативным и двумя или более факторными признаками называется множественной регрессией. При исследовании зависимостей методами множественной регрессии ставят 2 задачи.

1.Определение аналитического выражения связи между результативным признаком у и фактическими признаками х1, х2, х3, .хк, т.е. найти функцию у= f(х1, х2, .хк)

2.Оценка тесноты связи между результативным и каждым из      факторных признаков.

         Корреляционно-регрессионная модель (КРМ) – такое уравнение регрессии, которое включает основные факторы, влияющие на вариацию результативного признака.

         Построение модели множественной регрессии включает этапы:  

1. выбор формы связи

2.                отбор факторных признаков

3.                обеспечение достаточного объема совокупности для получения верных оценок.

Все множество связей между  переменными, встречающиеся  на практике достаточно полно описывается функциями 5-ти видов:

1.                линейная: http://works.tarefer.ru/75/100101/pics/image166.gif

 

2.                степенная: http://works.tarefer.ru/75/100101/pics/image167.gif

 

3.                показательная: http://works.tarefer.ru/75/100101/pics/image168.gif

 

4.                парабола: http://works.tarefer.ru/75/100101/pics/image169.gif

  

5.                гипербола: http://works.tarefer.ru/75/100101/pics/image170.gif

 

хотя все 5 функций присутствуют в практике КРА, наиболее часто используется линейная зависимость, как наиболее простая и легко поддающаяся интерпретации

уравнение линейной зависимости: http://works.tarefer.ru/75/100101/pics/image171.gif,

к – множество факторов включающихся в уравнение,

bj –коэффициент условно-чистой регрессии, который показывает среднее по совокупности отклонение результативного признака от его среднего значения при отклонении фактора xj от своей средней величины на единицу при условии, что все  остальные факторы, входящие в уравнение сохраняют средние значения.

Параметры уравнения множественной регрессии и определение  с помощью МНК.

Отбор факторов для включения в уравнение множественной регрессии:

  • между результативным и фактическим признаками должна быть причинно-следственная зависимость.
  • результативный и фактический признаки должны быть тесно связаны между собой иначе возникает явление мультиколлинеарности (>06), т.е. включенные в уравнение факторные признаки влияют не только на результативный, но друг на друга, что влечет к неверной интерпретации числовых данных.

 Методы отбора факторов для включения в уравнение множественной регрессии:

1.экспертный метод – основан на интуитивно логическом анализе который выполняется высококвалифицированными экспертами.

2.использование матриц парных коэффициентов корреляции осуществляется  параллельно с первым методом, матрица симметрична относительно единичной диагонали.

3.пошаговый регрессионный анализ – последовательное включение факторных признаков в уравнение регрессии и проверки значимости проводится на основании значений двух показателей на каждом шаге. Показатель корреляции, регрессии. Показатель корреляции: рассчитывают изменение теоретической корреляции отношения или изменение средней остаточной дисперсии. Показатель регрессии – изменение коэффициента условно чистой регрессии.

 

Предыдущие материалы: Следующие материалы: