Основные теоретические сведения. На любой экономический показатель чаще всего оказывает влияние не один, а несколько факторов
На любой экономический показатель чаще всего оказывает влияние не один, а несколько факторов. Обозначим через Х1, Х2,…, Хm объясняющие переменные, влияющие на одну зависимую переменную Y. В этом случае возникает задача установления формы зависимости между переменными и определения функции регрессии. Тогда вместо парной регрессии рассматривается множественная регрессия.
Множественная регрессия – уравнение связи с несколькими объясняющими (независимыми) переменными:
Y= f (х1, х2, …,хm), (2.1)
т.е. условное математическое ожидание имеет вид (2.1):
М(Y/ х1, х2, …,хm) = f (х1, х2, …,хm). (2.2)
Если между переменными наблюдается линейная зависимость, тогда модель множественной линейной регрессии можно представить в виде:
Y = 0 + 1 Х1 + 2 Х2 + …+ m Хm + , (2.3)
или для индивидуальных наблюдений i, i = 1,2,…,n:
yi = 0 + 1 xi1 + 2 xi2 + …+ m xim + i , (2.4)
= ( 0 , 1 , 2 , …, m)т – вектор параметров, подлежащий определению.
Как и в случае парной регрессии по выборочным данным мы можем получить только эмпирическое уравнение модели:
Y = b0 + b1 Х1 + b2 Х2 + …+ bm Хm + e . (2.5)
Или для индивидуальных наблюдений:
уi = b0 + b1 xi1 + b2 xi2 + …+ bm xim + ei . (2.5)
Здесь В = (b0 , b1 , b2 , …, bm)т - оценка вектора .
Для определения оценок b0 , b1 , b2 , …, bm воспользуемся матричным МНК. Представим данные наблюдений и коэффициенты в матричном виде:
, , , .
Тогда уравнение множественной линейной регрессии второго рода запишем в виде: = Х В . (2.6)
Остаточная сумма квадратов в данном случае равна
. (2.7)
Результатом минимизации (2.7) является вектор:
B = (XT X)-1 XT Y . (2.8)
Оценки вектора В (2.8) являются несмещенными и эффективными, если выполняются предпосылки множественного регрессионного анализа [1].
Вычислим дисперсии коэффициентов регрессии b0 , b1 , b2 , …, bm, которые используются для оценки их точности, определения доверительных интервалов для теоретических коэффициентов 0 , 1 , 2 , …, m и проверки соответствующих гипотез. Вариации оценок параметров будут определять и точность уравнения множественной регрессии. Для измерения их в многомерном регрессионном анализе используют ковариационную матрицу вектора оценок
.
Дисперсии коэффициентов вычисляются по формулам [1]:
, (2.9)
В (2.9) S2 – дисперсия регрессии, вычисляется по формуле:
S2 = ( (еi2 ))/(n – m – 1) , (2.10)
- j-й (j = 0, 1,…,m) диагональный элемент матрицы
Z-1 = (XT X)-1. (2.11)
Оценка качества уравнения множественной линейной регрессии 2-го рода определяется следующими характеристиками:
- доверительными интервалами для коэффициентов регрессии и их статистической значимостью;
- оценкой коэффициента детерминации и его статистической значимостью;
- выполнением предпосылок МНК;
- прогнозом значений зависимой переменной и его параметрами
1. Проверка статистической значимости коэффициентов регрессии.