Оценка и интерпретация параметров.

Для анализа статистической значимости полученных коэффициентов множественной линейной регрессии оценивают дисперсию D(ai) и стандартные отклонения S(ai)=ÖD(ai) коэффициентов ai. Аналогично (10) величина t=ai/S(ai), называемая t–статистикой, имеет распределение Стьюдента с (n-m-1) степенями свободы. Если число степеней свободы достаточно велико (не менее 10), то при 5%-ном уровне значимости можно приближенно считать оценку незначимой, если t–статистика по модулю меньше 1, и весьма надежной, если модуль t–статистики больше 3.

Коэффициенты множественной линейной регрессии ai имеют большой экономический смысл. Они показывают, на сколько изменится анализируемый показатель Y при изменении фактора Хi на единицу.

Пример 3.1. Рассмотрим аналитические модели спроса, используя ниже приведенные в табл.3.1 конкретные статистические данные обследования семей, сведенные в девять групп (с примерно одинаковым объемом потребления).

Таблица 3.1

№ группы Расход на питание (у) Душевой доход (х1) Размер семей (х2) ŷ ej ej2
1,5 333,6 99,4 9880,36
2,1 626,5 –10,5 110,25
2,7 928,5 –28,5 812,25
3,2 1189,8 –76,8 5898,24
3,4 1340,5 –34,5 1190,25
3,6 1493,6 –5,6 31,36
3,7
4,0 1879,1 34,9
3,7 2409,5 1,5 2,25
Средние Оценка и интерпретация параметров. - student2.ru =1313,9 Оценка и интерпретация параметров. - student2.ru 1 =6080,5 Оценка и интерпретация параметров. - student2.ru 2 =3,1     2198,2

Рассмотрим сначала однофакторную линейную модель зависимости расходов на питание (у) от величины душевого дохода (х1)

ŷ =а0 + а1х1,

параметры которой а0 и а1 находятся по формулам (2.5), используя данные табл.3.1 и Оценка и интерпретация параметров. - student2.ru =(∑х12)/9=63989644,1, Оценка и интерпретация параметров. - student2.ru =(∑х1у)/9)=10894351. Решение: а0=660,06; а1 = 0,1075. Получаем уравнение регрессии ŷ =660,06 + 0,1075х1.

Затем вычисляются средняя квадратическая ошибка выборки (корень квадратный из дисперсии у)

Sу=√(∑(у – у)2)/n,

средняя квадратическая ошибка уравнения (2.3) Sŷ =√(∑(у – ŷ)2)/n и коэффициент детерминации Rŷх1 =√1 – Sŷ2/ Sу2.

В нашем примере Sу2=454070, Sŷ2=63846, следовательно

Rŷх1 =√1 – 63846/454070 =0,927.

Полученное значение свидетельствует, что связь между расходами на питание и душевым доходом очень тесная.

Величина R2ŷх1показывает долю изменения результативного признака под воздействием факторного признака. В нашем примере R2ŷх1 =0,859; это означает, что фактором душевого дохода можно объяснить почти 86% изменения расходов на питание.

Рассмотрим теперь двухфакторную линейную модель зависимости расходов на питание (у) от величины душевого дохода (х1) и размера семьи (х2)

ŷ =а0 + а1х1+ а2х2 .

Параметры модели а0 , а1и а2 находятся посредством решения следующей системы нормальных уравнений:

а0 + х1а1 + х2а2 = у

х1а0 + Оценка и интерпретация параметров. - student2.ru а1 + х1х2 а2 = ух1

х2а0 + х1х2 а1+ Оценка и интерпретация параметров. - student2.ru а2 = ух2,

которая также формируется с применением метода наименьших квадратов (средние величины х1х2 , Оценка и интерпретация параметров. - student2.ru и ух2вычисляются аналогично однофакторной модели). Получаем систему

а0 + 6080,5а1 + 3,1а2 = 1313,9

6080,5а0 + 63989644,1а1 + 21649,1а2 = 10894351

3,1а0 + 21649,1а1 + 10,2а2 = 4488,

которую решаем, например, методом Гаусса.

Делим второе и третье уравнения на коэффициент при а0.

а0 + 6080,5а1 + 3,1а2 = 1313,9

а0 + 10523,75а1 + 3,56а2 = 1791,69

а0 + 6983,58а1 + 3,29а2 = 1447,74.

От второго и третьего уравнения отнимаем первое

а0 + 6080,5а1 + 3,1а2 = 1313,9

4443,25а1 + 0,46а2 = 477,79

903,08а1+ 0,19а2 = 133,84.

Делим второе и третье уравнения на коэффициент при а1.

а0 + 6080,5а1 + 3,1а2 = 1313,9

а1 + 0,0001035а2 = 0,1075316

а1+ 0,0002104а2 = 0,1482039.

От третьего уравнения отнимаем второе

а0 + 6080,5а1 + 3,1а2 = 1313,9

а1 + 0,0001035а2 = 0,1075316

0,0001069а2= 0,0406723.

Из третьего уравнения находим а2 =380.47; подставляя его во второе уравнение получаем а1 = 0,06815; подставляя найденные а1и а2 в первое уравнение, получаем а0 = –279.94; следовательно

ŷ = –279.94 + 0.06815х1+ 380.47х2 .

Для определения тесноты связи предварительно вычисляются теоретические значения ŷ, затем уклонения ej и их квадраты (колонки 5,6,7 табл.3.1). Получим Sŷ2 =(∑(у – ŷ)2)/n =2198,2. Используя ранее вычисленное Sу2=454070, получим R2 =1 – Sŷ2/ Sу2 =0,995. R2 показывает долю вариации результативного признака под воздействием изучаемых факторных признаков. У нас R2=0,995; это означает, что совместное влияние душевого дохода и размера семей объясняет почти 99,5% изменения расходов на питание.

Наши рекомендации