Оценка качества линейной модели регрессии
Основным показателем качества уравнения множественной регрессии является множественный коэффициент детерминации, определяемый по формуле (2.19), либо по формуле в матричных обозначениях:
. | (3.18) |
Множественный коэффициент детерминации характеризует долю вариации результата Y, обусловленной регрессией, т. е. вариацией всех включенных в модель факторов. Чем ближе R2 к единице, тем лучше модель описывает зависимость между факторами и результатом Y.
Показателем качества модели может служить и скорректированный коэффициент детерминации (3.9). Если его значение превышает 0,5, то качество модели считается удовлетворительным.
Проверка значимости уравнения множественной регрессии производится по F-критерию Фишера [см. § 2.3 и формулу (2.21)]. Значимость коэффициентов уравнения проверяется по t-критерию Стьюдента. Стандартная ошибка коэффициента bj уравнения регрессии определяется по формуле
, | (3.19) |
где — диагональный элемент матрицы .
Доверительный интервал для истинного параметра bj имеет вид:
, | (3.20) |
где tтаб — табличное значение t-критерия Стьюдента в соответствии с уровнем значимости и числом степеней свободы остатка (см. приложение 3); g — доверительная вероятность.
Если нижняя граница доверительного интервала имеет отрицательное значение, а верхняя — положительное, то считается, что коэффициент bj сформировался под влиянием случайных причин, а изменение соответствующего фактора Xj не оказывает существенного влияния на изменение результата Y.
Компьютерные программы обычно рассчитывают для каждого из коэффициентов уравнения регрессии t-статистику Стьюдента
(3.21) |
и так называемое «P-Значение» — вероятность того, что коэффициент bj сформировался случайным образом.
Коэффициент bj признается статистически значимым на уровне значимости a, если выполняется неравенство
, | (3.22) |
где tтаб — табличное значение t-критерия Стьюдента в соответствии с уровнем значимости a и числом степеней свободы (см. приложение 3).
На значимость коэффициента указывает и его «P‑Значение», не превышающее принятый уровень значимости a.
Если значимость коэффициента bj не установлена, то все выводы относительно него и соответствующего фактора Xj не вполне надежны. Если значение t-статистики при этом больше единицы (по абсолютной величине), то фактор Xj все же считается в какой-то степени информативным. Если же t-статистика по модулю меньше единицы, то фактор Xj следует исключить из модели. Затем уравнение регрессии строится уже без исключенного фактора, все расчеты и анализ при этом повторяются.
Показателями точности модели множественной регрессии также как и парной модели служат стандартная ошибка регрессии Sрег (3.17) и средняя относительная ошибка аппроксимации Eотн (2.23).