Корреляционно-регрессионные модели.

Корреляционно – регрессионные модели. Постановка задачи – наиболее важный момент в построении корреляционных моделей. От точности поставленной задачи в дальнейшем будет зависеть вся работа. В качестве уточнения постановки задачи проводится теоретический и логический анализ результирующего и определяющего факторов. Здесь определяются границы выборочной совокупности и определяется круг факторов, которые будут исследоваться.

Сбор исходной информации. Самая трудоемкая работа. Исходная информация формируется в виде таблиц, в которых содержатся значения результирующего и определяющих факторов.

После завершения сбора исходной информации приступают к статистической оценке значимости факторов. Статистическая оценка значимости проводится путем расчета коэффициентов парной корреляции. В результате получаются корреляционные матрицы, которые потом подвергаются визуальному анализу.

Таблица 5.1.

Корреляционная матрица

xij yi xi1 xi2 xim
y1 r11 r12 r1m
y2 r21 r22 r2m
y3 r31 r32 r3m
yn rn1 rn2 rnm

Следующий шаг - построение эмпирических уравнений регрессии (для определения характера влияния определяющих факторов на результирующий). Для каждого факторного признака Xij на график наносятся точки с координатами (yi, xij)

Затем определяется минимальное и максимальное значение X и Y. Отрезок [xjmin, xjmax] делится на ряд интервалов. В результате получаем:

Корреляционно-регрессионные модели. - student2.ru , (5.15)

где: N – число интервалов.

Для каждого интервала (∆x) определяется точка со средним значением Корреляционно-регрессионные модели. - student2.ru . Затем на графике эти средние значения соединяются отрезками, мы получаем эмпирическую линию регрессии, при необходимости эта линия регрессии может быть сглажена. В результате получаем некоторую линию, которая отражает характер влияния определяющего фактора на результирующий. Зная характер зависимости, можно выбрать форму сглаживающей кривой. На этом этап предварительной обработки информации заканчивается.

Расчетный этап. Как правило, в социально-экономических исследованиях используют многофакторные модели, но в некоторых случаях полезными являются и однофакторные модели. Однофакторные модели, как правило, строятся при помощи метода наименьших квадратов. Зависимости, которые используются:

- линейная - Корреляционно-регрессионные модели. - student2.ru ;

- степенная - Корреляционно-регрессионные модели. - student2.ru ;

- экспоненциальная - Корреляционно-регрессионные модели. - student2.ru

Следующий шаг – построение многофакторной модели. В качестве основных сглаживающих функций выступают линейные многочлены и мультистепенные функции

Метод расчета – метод наименьших квадратов. Расчеты могут осуществляться в матричной форме. При необходимости в начале проводят процедуру выравнивания.

Затем проводится оценка адекватности и точности построения моделей.

Адекватность полученных моделей, оценивается при помощи нескольких показателей. Полноту учета всех факторов, влияющих на результирующий признак характеризует коэффициент множественной корреляции, он определяется:

Корреляционно-регрессионные модели. - student2.ru , (5.16)

Корреляционно-регрессионные модели. - student2.ru – остаточная дисперсия, т.е. это характеристика, которая показывает рассеяние случайной величины Корреляционно-регрессионные модели. - student2.ru относительную уравнения регрессии

Корреляционно-регрессионные модели. - student2.ru - дисперсия Корреляционно-регрессионные модели. - student2.ru относительно среднего значения

Используется коэффициент детерминации – это коэффициент множественной корреляции в квадрате (R ),он показывает долю изменчивости результативного признака за счет всех факторов, включенных в модель. Точность модели можно оценить по средней относительной ошибке.

Корреляционно-регрессионные модели. - student2.ru (5.17)

Корреляционно-регрессионные модели. - student2.ru показывает на сколько процентов расчетные значения в среднем отклоняются от фактических. Можно рассчитать доверительный интервал, который показывает пределы возможных значений у. Величина доверительного интервала определяется:

Корреляционно-регрессионные модели. - student2.ru (5.18)

где t – доверительная вероятность, которая зависит от уровня риска; Корреляционно-регрессионные модели. - student2.ru - среднеквадратическое отклонение i-го расчетного значения у от фактического.

При этом считается, что Корреляционно-регрессионные модели. - student2.ru распределены по нормальному закону с одинаковой дисперсией, а за ее оценку принимается значение остаточной дисперсии.

Для оценки адекватности используются также критерии согласия. Могут использоваться критерии Фишера, Стьюдента, Пирсона и др.

Наши рекомендации