Корреляционно-регрессионный анализ и моделирование статистических связей
Современная наука исходит из взаимосвязи всех явлений природы и общества.
Различают 2 типа связей между различными явлениями и их признаками: функциональная (жестко детерминированная) и статистическая (стахостически детерминированная) связи.
Если с изменением значения одной из переменных вторая изменяется строго определенным образом, т.е. значению одной переменной соответствует одно или несколько точно заданных значений другой переменной, - то связь между ними является функциональной.
1) -- функциональная связь
Стохастически детерминированная связь не имеет ограничений и условий, присущих функциональной связи.
Если с изменением значения одной из переменных вторая может в определенных пределах принимать любые значения, то связь называется стохастической, т.е. при разных значениях одной переменной существуют соответствующие разные значения другой переменной.
Модель стохастической связи:
2) ,
где f (xi) - часть результативного признака, сформировавшаяся под воздействием учтенных, известных факторных признаков (одного или множества).
i - часть результативного признака, возникшая вследствии действия неконтролированного, неучтенного фактора.
Корреляционной связью называют важнейший частный случай стохастической связи, состоящей в том, что разным значениям одной переменной соответствуют различные средние значения другой.
Корреляционная связь между признаками может возникать разными путями:
1) Причинная зависимость результативного признака от вариации факторного признака.
2) Совершенно иная интерпретация необходима для изучения корреляционной связи между двумя следствиями общей причины.
3) Возникновение корреляции: взаимосвязь признаков, каждый из которых и причина и следствие.
Поскольку корреляционная связь является статистической, первым условием возможности ее изучения является наличие данных по достаточно большой совокупности явлений.
Главной характеристикой корреляционной связи является изучение линии регрессии.
Теоретической линией регрессии называется та линия, вокруг которой группируются точки корреляционного поля, и которая указывает основное направление, тенденцию. Эта линия должна быть проведена так, чтобы сумма отклонений точек поля корреляции от соответствующих точек теоретической линии регрессии, равнялась нулю, а сумма квадратов этих отклонений была бы минимальной.
КРА состоит из следующих этапов: 1) выбор формы регрессии; 2) определение параметров уровня; оценка тесноты связи; 4) проверка адекватности моделеи уравнения.
Наиболее часто встречается для характеристики экономических показателей, используются следующие типы функций:
Наиболее применяемой в статистическом анализе является линейная функция:
4) Y = a + bx,
где а - свободный член уравнения;
b - коэффициент регрессии, который показывает на сколько единиц в среднем изменяется величина результативного признака U при изменении факторного признака х на единицу.
Определение параметров уравнения регрессии проводится методом наименьших квадратов, основным условием которого является минимизация суммы квадратов отклонений эмпирических значений от теоретических.
5)
Дисперсию теоретических значений называют факторной и вычисляют по формуле:
Факторная дисперсия:
6)
Вместо средней из внутригрупповых дисперсии вычисляют остаточную (случайную) дисперсию.
Остаточная дисперсия:
7)
Общая дисперсия:
8)