Оценка статистической значимости параметров уравнения регрессии
С помощью МНК мы получили лишь оценки параметров уравнения регрессии, которые характерны для конкретного статистического наблюдения (конкретного набора значений x и y). Если оценку параметров произвести по данным другого статистического наблюдения (другому набору значений x и y), то получим другие численные значения , . Мы предполагаем, что все эти наборы значений x и y извлечены из одной и той же генеральной совокупности. Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности используют статистические методы проверки гипотез.
В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности. В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.
Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике). Табличное значение определяется в зависимости от уровня значимости (a) и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n-число наблюдений.
Если фактическое значение t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-a) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.
Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости a.
Для параметра b критерий проверки имеет вид:
,
где - оценка коэффициента регрессии, полученная по наблюдаемым данным;
– стандартная ошибка коэффициента регрессии.
Для линейного парного уравнения регрессии стандартная ошибка коэффициента вычисляется по формуле:
.
Числитель в этой формуле может быть рассчитан через коэффициент детерминации и общую дисперсию признака-результата: .
Для параметра a критерий проверки гипотезы о незначимом отличии его от нуля имеет вид:
,
где - оценка параметра регрессии, полученная по наблюдаемым данным;
– стандартная ошибка параметра a.
Для линейного парного уравнения регрессии:
.
Для проверки гипотезы о незначимом отличии от нуля коэффициента линейной парной корреляции в генеральной совокупности используют следующий критерий:
, где ryx - оценка коэффициента корреляции, полученная по наблюдаемым данным; mr – стандартная ошибка коэффициента корреляции ryx.
Для линейного парного уравнения регрессии:
.
В парной линейной регрессии между наблюдаемыми значениями критериев существует взаимосвязь: t (b=0)=t(r=0).
Прогноз ожидаемого значения результативного признака y по линейному парному уравнению регрессии.
Пусть требуется оценить значение признака-результата для заданного значения признака-фактора (хр). Прогнозируемое значение признака-результата c доверительной вероятностью равной (1-a) принадлежит интервалу прогноза:
( -t·mp; +t·mp),
где - точечный прогноз;
t – коэффициент доверия, определяемый по таблицам распределения Стьюдента в зависимости от уровня значимости a и числа степеней свободы (n-2);
mp- средняя ошибка прогноза.
Точечный прогноз рассчитывается по линейному уравнению регрессии, как: .
Средняя ошибка прогноза определяется по формуле:
.
Задание №1
На основе данных, приведенных в Приложении 1 и соответствующих Вашему варианту (таблица 2), требуется:
1. Рассчитать коэффициент линейной парной корреляции и построить уравнение линейной парной регрессии одного признака от другого. Один из признаков, соответствующих Вашему варианту, будет играть роль факторного (х), другой – результативного (y). Причинно-следственные связи между признаками установить самим на основе экономического анализа. Пояснить смысл параметров уравнения.
2. Определить теоретический коэффициент детерминации и остаточную (необъясненную уравнением регрессии) дисперсию. Сделать вывод.
3. Оценить статистическую значимость уравнения регрессии в целом на пятипроцентном уровне с помощью F-критерия Фишера. Сделать вывод.
4. Выполнить прогноз ожидаемого значения признака-результата y при прогнозном значении признака-фактора х, составляющим 105% от среднего уровня х. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал с вероятностью 0,95.
Таблица 2
Вариант | Номер начального наблюдения | Номер конечного наблюдения | Номер признаков из прил. 1 | Вариант | Номер начального наблюдения | Номер конечного наблюдения | Номер признаков из прил. 1 |
1,2 | 1,3 | ||||||
3,4 | 4,5 | ||||||
1,3 | 1,4 | ||||||
4,5 | 2,5 | ||||||
1,4 | 1,5 | ||||||
2,5 | 2,3 | ||||||
1,5 | 1,2 | ||||||
2,3 | 3,4 | ||||||
1,2 | 1,3 | ||||||
3,4 | 4,5 | ||||||
1,3 | 1,4 |
Продолжение табл. 2
4,5 | 2,5 | ||||||
1,4 | 1,5 | ||||||
2,5 | 2,3 | ||||||
1,5 | 1,2 | ||||||
2,3 | 3,4 | ||||||
1,2 | 1,3 | ||||||
3,4 | 4,5 | ||||||
1,3 | 1,4 | ||||||
4,5 | 2,5 | ||||||
1,4 | 1,5 | ||||||
2,5 | 2,3 | ||||||
1,5 | 1,2 | ||||||
2,3 | 3,4 | ||||||
1,2 | 1,3 | ||||||
3,4 | 4,5 | ||||||
1,3 | 1,4 | ||||||
4,5 | 2,5 | ||||||
1,4 | 1,5 | ||||||
2,5 | 2,3 | ||||||
1,5 | 1,2 | ||||||
2,3 | 3,4 | ||||||
1,2 | 1,3 | ||||||
3,4 | 4,5 | ||||||
1,3 | 1,4 | ||||||
4,5 | 2,5 | ||||||
1,4 | 1,5 | ||||||
2,5 | 2,3 | ||||||
1,5 | 1,2 | ||||||
2,3 | 3,4 | ||||||
1,2 | 1,3 | ||||||
3,4 | 4,5 | ||||||
1,3 | 1,4 | ||||||
4,5 | 2,5 | ||||||
1,4 | 1,5 | ||||||
2,5 | 2,3 | ||||||
1,5 | 1,2 | ||||||
2,3 | 3,4 |
Окончание табл. 2