Модель парной линейной регрессии

Мы уже отмечали ранее, что если между переменными х и у существует теоретическая линейная связь в виде

y = α + βx, (2.1)

то наблюдаемые значения xi, yi, i =1, 2, …, n этих переменных связаны линейной моделью наблюдений

Модель парной линейной регрессии - student2.ru (2.2)

Если α и β – истинные значения параметров линейной модели связи, то величина εi = yi - (α +βxi) представляет собой ошибку в i-м наблюдении.

Поиск коэффициентов α и β осуществляется таким образом, чтобы величина ε Модель парной линейной регрессии - student2.ru стремилась к минимуму (в идеале к нулю). Если εi = 0, то все точки лежат на одной прямой. В результате получают подобранную модель линейной связи

Модель парной линейной регрессии - student2.ru Модель парной линейной регрессии - student2.ru .

В подобранной модели наблюдаемому значению x Модель парной линейной регрессии - student2.ru переменной х сопоставляется значение Модель парной линейной регрессии - student2.ruпеременной у. Значения подобранное Модель парной линейной регрессии - student2.ruи реальное наблюдаемое у обычно отличаются. Разность

Модель парной линейной регрессии - student2.ru называется остатком в i-м наблюдении.

Метод наименьших квадратов оценки параметров парной регрессионной модели

Для реальных данных, как правило, все остатки отличны от нуля, так что часть из них имеет положительный знак, а остальные – отрицательный. При этом необходимо соблюдение принципа наименьших квадратов

Модель парной линейной регрессии - student2.ru

Модель парной линейной регрессии - student2.ru (2.5)

Получаемые при этом оценки а и b называются оценками наименьших квадратов. Свойством оценок наименьших квадратов является то, что соответствующая им прямая проходит через точку Модель парной линейной регрессии - student2.ru . Поиск пары чисел а и b с помощью метода наименьших квадратов (МНК) сводятся к математической задаче поиска точки минимума функции двух переменных. В результате получаем коэффициенты в подобранной модели

Модель парной линейной регрессии - student2.ru , (2.6) Модель парной линейной регрессии - student2.ru , (2.7)

где Модель парной линейной регрессии - student2.ru

При подстановке в формулу (2.3) выражения (2.7) получаем оценку уравнения парной линейной регрессии (функция регрессии)

Модель парной линейной регрессии - student2.ru .

Статистические свойства МНК-оценок параметров уравнения регрессии

При выполнении стандартных предположений регрессионного анализа, МНК-оценки параметров уравнения регрессии будут обладать следующими статистическими свойствами:

1. Несмещенность.

Статистическая оценка некоторого параметра называется несмещенной, если ее математическое ожидание равно истинному значению этого параметра. В случае парной линейной регрессии: М(a)=α, М(b)=ß.

2. Состоятельность.

При неограниченном возрастании объема выборки значение оценки должно стремиться по вероятности к истинному значению параметра, а дисперсии оценок параметров должны уменьшаться и в пределе стремиться к 0: Модель парной линейной регрессии - student2.ru , Модель парной линейной регрессии - student2.ru при Модель парной линейной регрессии - student2.ru .

3. Эффективность.

Оценка называется эффективной, если она имеет минимальную дисперсию по сравнению с другими оценками заданного класса.

Наши рекомендации