Анализ качества эмпирического уравнения множественной линейной регрессии

Проверка статистического качества оцененного уравнения регрессии проводится по следующим направлениям:

• проверка статистической значимости коэффициентов уравнения регрессии;

• проверка общего качества уравнения регрессии;

• проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК).

Статистическая значимость коэффициентов множественной линейной регрессии с т объясняющими переменными проверяется на основе t-статистики:

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . (6.31)

имеющей в данной ситуации распределение Стьюдента с числом степеней свободы Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru (п — объем выборки). При требуемом уровне значимости наблюдаемое значение t-статистики сравнивается с критической точкой Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru распределения Стьюдента.

Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru коэффициент Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru считается статистически значимым. В противном случае коэффициент Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru считается статистически незначимым (статистически близким к нулю), то есть фактор Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru линейно не связан с зависимой переменной Y и его можно исключить из набора объясняющих переменных.

Зачастую строгая проверка значимости коэффициентов заменяется простым сравнительным анализом.

Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то коэффициент статистически незначим.

Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то коэффициент относительно значим. В данном случае рекомендуется воспользоваться таблицей критических точек распределения Стьюдента.

Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то коэффициент значим. Это утверждение является гарантированным при Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru и Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru .

Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то коэффициент считается сильно значимым.

Вероятность ошибки в данном случае при достаточном числе наблюдений не превосходит 0,001.

После проверки значимости каждого коэффициента регрессии обычно проверяется общее качество уравнения регрессии. Для этой цели, как и в случае парной регрессии, используется коэффициент детерминации Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , который в общем случае рассчитывается по формуле

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . (6.32)

Для линейного уравнения регрессии данный показатель может быть рассчитан через Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru - коэффициенты:

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . (6.33)

Для множественной, регрессии коэффициент детерминации является неубывающей функцией числа объясняющих переменных. Добавление новой объясняющей переменной никогда не уменьшает значение Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . Иногда при расчете коэффициента детерминации для получения несмещенных оценок в числителе и знаменателе вычитаемой из единицы дроби делается поправка на число степеней свободы. Вводится так называемый скорректированный (исправленный) коэффициент детерминации:

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . (6.34)

Здесь Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru является несмещенной оценкой общей дисперсии — дисперсии отклонений значений переменной Y от Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . При этом число ее степеней свободы равно Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . Одна степень свободы теряется при вычислении Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru .

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru является несмещенной оценкой остаточной дисперсии — дисперсии случайных отклонений (отклонений точек наблюдений от линии регрессии). Ее число степеней свободы равно Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . Потеря Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru степени свободы связана с необходимостью решения системы Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru линейного уравнения при определении коэффициентов эмпирического уравнения регрессии. Несмещенная оценка объясненной дисперсии (дисперсии отклонений точек на линии регрессии от Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru ) имеет число степеней свободы, равное разности степеней свободы общей дисперсии и остаточной дисперсии Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru .

Коэффициент детерминации в настоящее время рассматривается лишь как один из ряда показателей, который нужно проанализировать, чтобы уточнить строящуюся модель.

Анализ статистической значимости коэффициента детерминации

После оценки индивидуальной статистической значимости каждого из коэффициентов регрессии обычно анализируется совокупная значимость коэффициентов, то есть гипотеза об общей значимости — гипотезы об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru .  

Проверка данной гипотезы осуществляется на основе дисперсионного анализа сравнения объясненной и остаточной дисперсий.

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru (объясненная дисперсия)=(остаточная дисперсия),
Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru (объясненная дисперсия)>(остаточная дисперсия).

Строится F-статистика:

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , (6.35)

где Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru - объясненная дисперсия, Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru - остаточная дисперсия. При выполнении предпосылок МНК построенная F-статистика имеет распределение Фишера с числами степеней свободы Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . Если при требуемом уровне значимости Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru (где Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru - критическая точка распределения Фишера), то Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru отклоняется в пользу Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то есть объясненная дисперсия существенно больше остаточной дисперсии, а значит уравнение регрессии качественно отражает динамику изменения зависимой переменной Y.

Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то нет оснований для отклонения Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то есть объясненная дисперсия соизмерима с дисперсией, вызванной случайными факторами, и совокупное влияние объясняющих переменных модели несущественно, а следовательно, общее качество модели невысоко.

На практике вместо указанной гипотезы проверяют гипотезу о статистической значимости коэффициента детерминации Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru :

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru ,

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru .

Для проверки данной гипотезы используется следующая F-статистика:

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . (6.36)

Очевидно, что показатели F и Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru равны или не равны нулю одновременно. Нулевая гипотеза отклоняется, если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . Это равносильно тому, что Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , т.е. Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru статистически значим.

Однако статистическая значимость коэффициентов регрессии и близкое к единице значение коэффициента детерминации Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru не гарантирует высокое качество уравнения регрессии.


Статистика Дарбина—Уотсона

Наиболее известным критерием обнаружения автокорреляции между соседними членами является критерий Дарбина-Уотсона. Он основан на простой идее: если корреляция ошибок регрессии не равна нулю, то она присутствует и в остатках регрессии Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru получающихся в результате применения обычного метода наименьших квадратов.

Для анализа коррелированности отклонений вместо коэффициента корреляции

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru   (6.37)
Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru ,  

используют тесно с ним связанную статистику Дарбина-Уотсона DW, рассчитываемую по формуле

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . (6.38)

Действительно, Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru .

Здесь сделано допущение, что для больших Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru справедливо соотношение: Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru .

Тогда

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . (6.39)

Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru (положительная автокорреляция) и Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru (отрицательная автокорреляция) и Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru (автокорреляция отсутствует), то Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru . Во всех других случаях Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru .

Необходимым условием независимости случайных отклонений является близость к двойке значения статистики Дарбина—Уотсона. Тогда, если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , мы считаем отклонения от регрессии случайными.

Это означает, что:

· построенная линейная регрессия, вероятно, отражает реальную зависимость;

· скорее всего, не осталось неучтенных существенных факторов, влияющих на зависимую переменную;

· какая-либо другая нелинейная формула не превосходит по статистическим характеристикам предложенную линейную.

Возникает вопрос, какие значения DW можно считать статистически близкими к двум? Для ответа на этот вопрос разработаны специальные таблицы критических точек статистики Дарбина—Уотсона, позволяющие при данном числе наблюдений Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , количестве объясняющих переменных Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru и заданном уровне значимости Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru определять границы приемлемости (критические точки) наблюдаемой статистики DW.

Для заданных Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru в таблице указываются два числа: Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru - нижняя граница и Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru -верхняя граница. Для проверки гипотезы об отсутствии автокорреляции остатков используется числовой отрезок, изображенный на рис. 6.3.

Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru

Выводы осуществляются по следующей схеме.

Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то это свидетельствует о положительной автокорреляции остатков.

Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то это свидетельствует об отрицательной автокорреляции остатков.

При Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru гипотеза об отсутствии автокорреляции остатков принимается.

Если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru или Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru , то гипотеза об отсутствии автокорреляции не может быть ни принята, ни отклонена.

Не обращаясь к таблице критических точек Дарбина—Уотсона, можно пользоваться «грубым» правилом и считать, что автокорреляция остатков отсутствует, если Анализ качества эмпирического уравнения множественной линейной регрессии - student2.ru .

При наличии автокорреляции остатков полученное уравнение регрессии обычно считается неудовлетворительным.

Наши рекомендации