Метод наименьших квадратов в матричной форме

Для оценки параметров линейного уравнения множественной регрессии применяется метод наименьших квадратов. Скалярный вариант этого метода позволяет получать оценки параметров Метод наименьших квадратов в матричной форме - student2.ru путемрешения системы нормальных уравнений

Метод наименьших квадратов в матричной форме - student2.ru(3.5)

которая получается путем дифференцирования суммы квадратов отклонений

Метод наименьших квадратов в матричной форме - student2.ru . (3.6)

Современный подход к изложению регрессионного анализа основан на матричной алгебре. Поэтому ниже будет рассмотрен матричный вариант МНК.

Чтобы понять переход от скалярного представления регрессионной модели к матричному, запишем регрессионное уравнение для каждого Метод наименьших квадратов в матричной форме - student2.ru -го ( Метод наименьших квадратов в матричной форме - student2.ru ) наблюдения в виде следующей системы:

Метод наименьших квадратов в матричной форме - student2.ru (3.7)

Для удобства будем считать, что коэффициент Метод наименьших квадратов в матричной форме - student2.ru регрессионного уравнения в системе (4.7) умножен на специально введенную искусственную переменную Метод наименьших квадратов в матричной форме - student2.ru . С учетом введенной переменной эта система может быть записана следующим образом:

Метод наименьших квадратов в матричной форме - student2.ru . (3.8)

Введя обозначения

Метод наименьших квадратов в матричной форме - student2.ru ; Метод наименьших квадратов в матричной форме - student2.ru ; Метод наименьших квадратов в матричной форме - student2.ru ; Метод наименьших квадратов в матричной форме - student2.ru ,

перепишем (4.8) в компактной матричной форме

Метод наименьших квадратов в матричной форме - student2.ru . (3.9)

Сумма квадратов отклонений МНК для (4.9) записывается следующим образом:

Метод наименьших квадратов в матричной форме - student2.ru . (3.10)

Выполнив умножение в (3.10)

Метод наименьших квадратов в матричной форме - student2.ru

и продифференцировав по вектору Метод наименьших квадратов в матричной форме - student2.ru результат перемножения

Метод наименьших квадратов в матричной форме - student2.ru ,

получаем систему уравнений в матричной форме

Метод наименьших квадратов в матричной форме - student2.ru , (3.11)

решение которой позволяет записать выражение для оценки вектора параметров регрессионного уравнения следующим образом:

Метод наименьших квадратов в матричной форме - student2.ru . (3.12)

Если выполняются гипотезы, лежащие в основе модели множественной регрессии:

1) Метод наименьших квадратов в матричной форме - student2.ru – спецификация модели;

2) Метод наименьших квадратов в матричной форме - student2.ru –детерминированная матрица, имеющая максимальный ранг Метод наименьших квадратов в матричной форме - student2.ru ;

3a) Метод наименьших квадратов в матричной форме - student2.ru ; 3b) Метод наименьших квадратов в матричной форме - student2.ru ,

то оценки (3.12) обладают рядом полезных свойств, описание которых приводится ниже.

Прежде всего, покажем, что математическое ожидание оценок МНК равно Метод наименьших квадратов в матричной форме - student2.ru . Для этого представим оценку в следующем виде:

Метод наименьших квадратов в матричной форме - student2.ru

Метод наименьших квадратов в матричной форме - student2.ru . (3.13)

Приведенное представление совместно с гипотезой 3а) позволяет записать

Метод наименьших квадратов в матричной форме - student2.ru . (3.14)

Данное свойство принято назвать несмещенностью оценок МНК. Несмещенность – важное свойство, но его недостаточно для полного описания качественных характеристик вычисляемых по МНК оценок.

Второй качественной характеристикой является стандартная ошибка. Для ее получения вычислим ковариационную матрицу оценки Метод наименьших квадратов в матричной форме - student2.ru , т.е. математическое ожидание произведения отклонений оценки вектора параметров от своего математического ожидания

Метод наименьших квадратов в матричной форме - student2.ru . (3.15)

Так как из (4.13) следует Метод наименьших квадратов в матричной форме - student2.ru , то, произведя замену, получаем

Метод наименьших квадратов в матричной форме - student2.ru

Метод наименьших квадратов в матричной форме - student2.ru . (3.16)

Дисперсия Метод наименьших квадратов в матричной форме - student2.ru , фигурирующая в (4.16), обычно неизвестна и поэтому ее величина оценивается по выборочным наблюдениям, т.е. принимается равной

Метод наименьших квадратов в матричной форме - student2.ru , (3.17)

где Метод наименьших квадратов в матричной форме - student2.ru – вектор остатков, вычисление которых, в отличие от случайных составляющих Метод наименьших квадратов в матричной форме - student2.ru , становится возможным после построения регрессионного уравнения, так как Метод наименьших квадратов в матричной форме - student2.ru . Таким образом, ковариационная матрица векторной оценки имеет вид

Метод наименьших квадратов в матричной форме - student2.ru . (3.18)

Квадратные корни из элементов главной диагонали матрицы (3.18) принято называть стандартными ошибками коэффициентов регрессии. Эти ошибки обозначают Метод наименьших квадратов в матричной форме - student2.ru . По теореме Гаусса – Маркова оценки МНК имеют наименьшие стандартные ошибки в классе линейных (по Метод наименьших квадратов в матричной форме - student2.ru ) несмещенных оценок.

С помощью стандартных ошибок определяется уровень надежности вычисленных оценок коэффициентов регрессии: проверяются гипотезы относительно значимости оценок коэффициентов регрессии, строятся доверительные интервалы. Другими словами, с их помощью устанавливается надежность построенной модели.

Иногда построение уравнения множественной регрессии начинается с построения регрессии в стандартизованном масштабе

Метод наименьших квадратов в матричной форме - student2.ru , (3.19)

где Метод наименьших квадратов в матричной форме - student2.ru , Метод наименьших квадратов в матричной форме - student2.ru – стандартизованные переменные;

Метод наименьших квадратов в матричной форме - student2.ru – стандартизованные коэффициенты регрессии, которые принято называть бета-коэффициентами. Они получаются как решение системы нормальных уравнений в стандартизованном масштабе

Метод наименьших квадратов в матричной форме - student2.ru (3.20)

Коэффициентами системы (20) являются парные коэффициенты корреляции. Интересна содержательная интерпретация Метод наименьших квадратов в матричной форме - student2.ru - коэффициентов. В отличие от коэффициентов регрессии Метод наименьших квадратов в матричной форме - student2.ru , которые зависят от масштаба измерений зависимой и независимых переменных, эти коэффициенты свободны от такой зависимости и поэтому могут использоваться для ранжирования факторов по степени их влияния на моделируемый показатель. Связь коэффициентов множественной регрессии Метод наименьших квадратов в матричной форме - student2.ru со стандартизованными коэффициентами Метод наименьших квадратов в матричной форме - student2.ru определяется соотношением

Метод наименьших квадратов в матричной форме - student2.ru , (3.21)

что позволяет осуществить переход от стандартизованного уравнения к обычному, свободный член которого вычисляется через среднее значение по формуле

Метод наименьших квадратов в матричной форме - student2.ru . (3.22)

В случае необходимости (например, для ранжирования факторов по степени воздействия на моделируемый показатель) можно, не прибегая к построению стандартизованного уравнения, определить Метод наименьших квадратов в матричной форме - student2.ru - коэффициенты по коэффициентам регрессии Метод наименьших квадратов в матричной форме - student2.ru

Метод наименьших квадратов в матричной форме - student2.ru . (3.23)

Кроме того, Метод наименьших квадратов в матричной форме - student2.ru - коэффициенты могут использоваться для расчета множественного коэффициента корреляции

Метод наименьших квадратов в матричной форме - student2.ru , (3.24)

показывающего тесноту линейной связи независимых переменных, включенных в модель, с зависимой переменной.

В общем случае теснота совместного влияния факторов на моделируемый показатель оценивается индексом корреляции

Метод наименьших квадратов в матричной форме - student2.ru , (3.25)

значения которого для линейной модели совпадает с множественным коэффициентом корреляции.

Качество построенной модели в целом удобно оценивать с помощью коэффициента множественной детерминации, определяемого как квадрат индекса множественной корреляции, умноженного на 100

Метод наименьших квадратов в матричной форме - student2.ru (3.26)

и показывающего на сколько процентов изменение зависимой переменной объясняется соответствующими изменениями независимых переменных.

Для этих же целей, когда особое внимание обращается на статистическую значимость, используется скорректированный коэффициент множественной детерминации, рассчитываемый через скорректированный на число степеней свободы множественный индекс корреляции по формуле

Метод наименьших квадратов в матричной форме - student2.ru . (3.27)

Значимость уравнения множественной регрессии в целом оценивается с помощью дисперсионного отношения Фишера (F-критерия)

Метод наименьших квадратов в матричной форме - student2.ru . (3.28)

В числители критерия (3.28) стоит сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»), деленная на число степеней свободы Метод наименьших квадратов в матричной форме - student2.ru , а в знаменателе – остаточная сумма квадратов отклонений, деленная на ( Метод наименьших квадратов в матричной форме - student2.ru ) (остаточная дисперсия).

Если Метод наименьших квадратов в матричной форме - student2.ru , то построенная модель считается адекватной. Метод наименьших квадратов в матричной форме - student2.ru – это максимально возможное значение дисперсионного отношения Фишера при данных степенях свободы и доверительном уровне Метод наименьших квадратов в матричной форме - student2.ru (см. Приложение).

Частный F-критерий позволяет оценить статистическую значимость каждого из факторов, включенного в модель. Для фактора Метод наименьших квадратов в матричной форме - student2.ru значение частного F-критерия определяется по формуле

Метод наименьших квадратов в матричной форме - student2.ru . (3.29)

Статистическая значимость каждого коэффициента регрессии оценивается также с помощью t-критерия Стьюдента

Метод наименьших квадратов в матричной форме - student2.ru , (3.30)

где Метод наименьших квадратов в матричной форме - student2.ru – средняя квадратическая ошибка коэффициента регрессии, определяемая по формуле

Метод наименьших квадратов в матричной форме - student2.ru . (3.31)

Коэффициенты регрессии линейного уравнения интерпретируется как коэффициенты абсолютного роста. С их помощью можно рассчитать средние коэффициенты эластичности, которые определяются по формуле

Метод наименьших квадратов в матричной форме - student2.ru . (3.32)

Наши рекомендации