Оценка построенной модели регрессии и качества оцененных параметров
Как правило, оценка построенной регрессионной модели проводится на качество и на значимость.
Для оценки качества построенной модели регрессии можно использовать либо коэффициент детерминации, либо среднюю ошибку аппроксимации.
Коэффициент детерминации
или (1.22)
показывает долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака Соответственно, величина характеризует долю дисперсии показателя вызванную влиянием неучтенных в модели факторов и прочих причин.
Чем ближе к 1, тем качественнее регрессионная модель, т.е. построенная модель хорошо аппроксимирует исходные данные.
Средняя ошибка аппроксимации – это среднее относительное отклонение оценочных значений от фактических т.е.
(1.23)
Построенное уравнение регрессии считается удовлетворительным, если значение не превышает 10-12%.
Для линейной регрессии средний коэффициент эластичности находится по формуле:
(1.24)
Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат от своей величины при изменении фактора на 1% от своего значения.
F - тест
Оценка значимости уравнения регрессии проводится с помощью -критерия Фишера, который заключается в проверке гипотезы о статистической незначимости уравнения регрессии. Для этого выполняется сравнение фактического и критического (табличного) значений - критерия Фишера.
определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы, т.е.
или (1.25)
где n – численность выборки,
k – количество оцениваемых параметров при х (количество регрессоров).
– максимально возможное значение критерия под влиянием случайных факторов при степенях свободы =1, = -2 и уровне значимости находится из таблицы -критерия Фишера (Таблица 1 Приложение 1), либо, если для расчетов применяется табличный процессор Excel, то его можно рассчитать, используя функцию FРАСПОБР(α;ν1;ν2).
Уровень значимости – это вероятность отвергнуть правильную гипотезу при условии, что она верна.
Если то гипотеза об отсутствии связи изучаемого показателя с фактором отклоняется и делается вывод о существенности этой связи с уровнем значимости (т.е. уравнение регрессии значимо).
Если то гипотеза принимается и признается статистическая незначимость и ненадежность уравнения регрессии.
T – тест
Для линейной регрессии значимость оцененных коэффициентов регрессии определяется с помощью -критерия Стьюдента, согласно которому выдвигается гипотеза о случайной природе показателей, т.е. о незначимом их отличии от нуля. Далее рассчитываются фактические значения критерия для каждого из оцениваемых коэффициентов регрессии, т.е.
(1.26)
(1.27)
где и – стандартные ошибкипараметров линейной регрессии определяются по формулам:
(1.28)
(1.29)
– максимально возможное значение критерия Стьюдента под влиянием случайных факторов при данной степени свободы и уровне значимости находится из таблицы критерия Стьюдента (таблица 2 приложение 1), либо, если для расчетов применяется табличный процессор Excel, то его можно рассчитать, используя функцию CТЬЮДРАСПОБР(1-α;υ2).
Если то гипотеза о несущественности коэффициента регрессии отклоняется с уровнем значимости т.е. коэффициент ( или )не случайно отличается от нуля и сформировался под влиянием систематически действующего фактора
Если то гипотеза не отклоняется и признается случайная природа формирования параметра.
При проверке статистической значимости параметров модели можно использовать следующее приближенное правило[2]:
1) если |tфак| <1, то данный коэффициент не может быть признан значимым (доверительная вероятность меньше 0,7);
2) если 1< |tфак| <2, то данный коэффициент может быть признан значимым c доверительной вероятностью в диапазоне между 0,7 – 0,95;
3) 2< |tфак| <3, то данный коэффициент может быть признан значимым c доверительной вероятностью в диапазоне между 0,95 – 0,99;
4) если |tфак| >3, то значимость данного коэффициента очевидна (доверительная вероятность находится в диапазоне между 0,99 и выше).
При этом, чем больше объем выборки, тем надежнее вывод о значимости коэффициента.
См. дополнительно литературу: [1, с. 66 – 72], [2, с 302 -315], [3, c. 72 - 117], [5, с. 50-80], [7, с. 34 - 48], [8]; [9] [ ]
Значимость линейного коэффициента корреляции также проверяется с помощью -критерия Стьюдента, т.е.
(1.30)
Гипотеза о несущественности коэффициента корреляции отклоняется с уровнем значимости если
Замечание. Для парной линейной регрессии проверка гипотезы о значимости коэффициента и коэффициента корреляции равносильна проверке гипотезы о существенности уравнения регрессии в целом, т.е.
Для каждого полученного параметра парной линейной регрессии сначала рассчитывают предельную ошибку:
(1.31)
а затем рассчитываются доверительные интервалы:
(1.32)
Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается равным нулю, так как он одновременно не может принимать и положительное, и отрицательное значения.
См. дополнительно литературу: [1, с. 31 - 62]; [2, с. 302 -316]; [3, c. 72 -117]; [5, с. 60 - 64]; [7, с. 48 - 57]; [8]; [9].