Проверка общего качества уравнения регрессии
Общее качество уравнения регрессии оценивается по тому, как хорошо эмпирическое уравнение регрессии согласуется со статистическими данными. Иными словами, насколько широко рассеяны точки наблюдений относительно линии регрессии. Очевидно, что если все точки лежат на построенной прямой, то регрессия на «идеально» объясняет поведение зависимой переменной. Возможные соотношения между двумя переменными имеют наглядную графическую интерпретацию в виде так называемой диаграммы Венна.
Рис. 1.3
На рисунке 1.3, а сначала никак не влияет на . На следующем рисунке (1.3, б) влияние усиливается. В последнем случае (1.3, в) значения целиком определяются значениями .
Суммарно мерой общего качества уравнения регрессии является коэффициент детерминации . В случае парной регрессии коэффициент детерминации будет совпадать с квадратом коэффициента корреляции. В общем случае коэффициент детерминации рассчитывается по формуле:
(1.22)
Справедливо соотношение . Чем теснее линейная связь между и , тем ближе коэффициент детерминации к единице.
Пример.Для анализа зависимости объема потребления Y (у.е.) домохозяйства от располагаемого дохода X (у.е.) отобрана выборка n=12 (помесячно в течение года). Необходимо провести регрессионный анализ.
Данные и расчеты представлены в таблице 1.1
Таблица 1.1
103,63 | -1,63 | 2,66 | ||||||||
105,49 | -0,49 | 0,24 | ||||||||
106,43 | 1,57 | 2,46 | ||||||||
109,23 | 0,77 | 0,59 | ||||||||
115,77 | -0,77 | 0,59 | ||||||||
117,63 | -0,63 | 0,40 | ||||||||
118,57 | 0,43 | 0,18 | ||||||||
123,24 | 1,76 | 3,10 | ||||||||
| 130,71 | 1,29 | 1,66 | |||||||
134,45 | -4,45 | 19,8 | ||||||||
139,11 | 1,89 | 3,57 | ||||||||
143,78 | 0,22 | 0,05 | ||||||||
Сум-ма | - | 35,3 | ||||||||
Среднее | 125,25 | 120,67 | 15884,75 | 15298,08 | 14736,17 | - | - | - |
Согласно
Таким образом, уравнение парной регрессии имеет вид: . По этому уравнению рассчитаем , а также .
В нашем примере коэффициент может трактоваться как предельная склонность к потреблению. Фактически он показывает, на какую величину изменится объем потребления, если располагаемый доход возрастает на одну единицу. Свободный член определяет прогнозируемое значение при величине располагаемого дохода , равной нулю (т.е. автономное потребление).
Рассчитаем другие показатели.
; .
;
Проверим статистическую значимость коэффициентов и :
и .
Критическое значение при уровне значимости равно (см. приложение 1) . Так как , то это подтверждает статистическую значимость коэффициента регрессии . Аналогично для другого коэффициента: так как , то гипотеза о статистической значимости коэффициента отклоняется. Это означает, что в данном случае свободным членом уравнения регрессии можно пренебречь, рассматривая регрессию как .
Определим доверительные интервалы коэффициентов регрессии (по формуле 2.20), которые с надежность 95% будут следующими:
для
для
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных объемов потребления при неограниченно большом числе наблюдений и уровне дохода (формула 2.21):
.
Таким образом, этот интервал имеет вид: (147,4898; 158,7082).
Рассчитаем коэффициент детерминации (2.22):
.
Столь высокое значение коэффициента детерминации свидетельствует о высоком общем качестве построенного уравнения регрессии.