Модель простой линейной регрессии

Если функция регрессии линейная, то говорят о линейной регрессии. Линейная регрессия находит весьма широкое применение в эконометрике в связи с четкой экономической интерпретации ее параметров. Кроме того, построенное линейное уравнение может служить начальной точкой эконометрического анализа.

Простая линейная регрессия представляет собой линейную функцию между условным математическим ожиданием зависимой переменной Модель простой линейной регрессии - student2.ru и одной зависимой переменной X (xi – значения зависимой переменной в i-ом наблюдении):

Модель простой линейной регрессии - student2.ru . (5.5)

Для отражения того факта, что каждое индивидуальное значение yi отклоняется от соответствующего условного математического ожидания, необходимо ввести в соотношение (5.5) случайное слагаемое ei:

Модель простой линейной регрессии - student2.ru . (5.6)

Это соотношение называется теоретической линейной регрессионной моделью; b0 и b1 – теоретическими коэффициентами регрессии. Таким образом, индивидуальные значения yi представляют в виде двух компонент – систематической ( Модель простой линейной регрессии - student2.ru ) и случайной (ei). В общем виде теоретическую линейную регрессионную модель будем представлять в виде

Модель простой линейной регрессии - student2.ru . (5.7)

Основная задача линейного регрессионного анализа состоит в том, чтобы по имеющимся статистическим данным для переменных X и Y получить наилучшие оценки неизвестных параметров b0 и b1. По выборке ограниченного объема можно построить эмпирическое линейное уравнение регрессии:

Модель простой линейной регрессии - student2.ru , (5.8)

где Модель простой линейной регрессии - student2.ru – оценка условного математического ожидания Модель простой линейной регрессии - student2.ru , b0 и b1 – оценки неизвестных параметров b0 и b1, называемые эмпирическими коэффициентами регрессии. Следовательно, в конкретном случае

Модель простой линейной регрессии - student2.ru , (5.9)

где отклонение ei – оценка теоретического случайного отклонения ei.

Задача линейного регрессионного анализа состоит в том, чтобы по конкретной выборке (xi,yi) найти оценки b0 и b1 неизвестных параметров b0 и b1 так, чтобы построенная линия регрессии была бы наилучшей в определенном смысле среди всех других прямых. Другими словами, построенная прямая Модель простой линейной регрессии - student2.ru должна быть «ближайшей» к точкам наблюдений по их совокупности. Мерами качества найденных оценок могут служить определенные композиции отклонений ei. Например, коэффициенты b0 и b1 эмпирического уравнения регрессии могут быть оценены исходя из условия минимизации функции потерь (loss function): Модель простой линейной регрессии - student2.ru . Например, функции потерь могут быть выбраны в следующем виде:



1) Модель простой линейной регрессии - student2.ru ; 2) Модель простой линейной регрессии - student2.ru ; 3) Модель простой линейной регрессии - student2.ru .

Самым распространенным и теоретически обоснованным является метод нахождения коэффициентов, при котором минимизируется первая сумма. Он получил название метод наименьших квадратов (МНК)[1]. Этот метод оценки является наиболее простым с вычислительной точки зрения. Кроме того, оценки коэффициентов регрессии, найденные МНК при определенных предпосылках, обладают рядом оптимальных свойств. Хорошие статистические свойства метода, простота математических выводов делают возможным построить развитую теорию, позволяющую провести тщательную проверку различных статистических гипотез. Минусы метода – чувствительность в «выбросам».

Метод определения оценок коэффициентов из условия минимизации второй суммы называется методом наименьших модулей. Этот метод обладает определенными достоинствами, например, по сравнению с методом наименьших квадратов он нечувствителен к выбросам (обладает робастностью). Однако у него имеются существенные недостатки. В первую очередь это связано со сложностью вычислительных процедур. Во-вторых, с неоднозначностью метода, т.е. разным значениям коэффициентов регрессии могут соответствовать одинаковые суммы модулей отклонений.

Метод минимизации максимума модуля отклонения наблюдаемого значения результативного показателя yi от модельного значения Модель простой линейной регрессии - student2.ru называется методом минимакса, а получаемая при этом регрессия минимаксной.

Среди других методов оценивания коэффициентов регрессии отметим метод максимального правдоподобия (ММП).

Наши рекомендации