Постановка и решение задачи линейной регрессии. Метод наименьших квадратов

Рассмотрим 2 случайные величины X и Y, заданные на одном и том же пространстве элементарных событий. Значениям Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru и Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru этих случайных величин соответствуют вероятности P Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru и P Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru , с которыми они принимаются.

Пусть каждой паре ( Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru , Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ) соответствует вероятность p( Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru , Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ) того, что Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru . Тогда говорят, что задано совместное распределение случайных величин X и Y.

Случайные величины называются независимыми, если для любых Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru , Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru справедливо равенство p( Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru , Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru )=P Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru P Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru .

По определению их ковариация равна Cov(X, Y)=M((X-MX)(Y-MY)), где буквой М обозначено мат.ожидание.

Через ρ(X, Y) будем обозначать коэффициент корреляции X и Y, который определяется как ρ(X, Y)= Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru , где DX, DY – дисперсии X и Y. Если случайные величины независимы, их ковариация равна нулю. Заметим, что обратное неверно: равенство нулю ковариации и коэффициента корреляции еще не гарантирует независимости случайных величин. Из определения и неравенства Коши-Буняковского следует, что коэффициент корреляции принимает значения между -1 и +1.

Будем говорить,что между случайными величинами X и Y имеется функциональная зависимость, если существует функция F(x) такая, что Y=F(x). Если же среднее значение одной случайной величины функционально зависит от значений, принимаемых другой, то будем говорить, что такие случайные величины связаны корреляционной зависимостью.

Выразим функционально один из двух взаимосвязанных факторов через другой (хотя бы приближенно). Простейшим из таких выражений является линейное: Y=aX+b, где a и b – некоторые константы.

Если справедливо равенство, то между X и Y имеется функциональная зависимость, даже линейная. Это бывает лишь в случаях, когда ρ(X, Y)=1 или ρ(X, Y)=-1. Если же –1< ρ(X, Y)<1, равенство может выполняться лишь приближенно, при условии, что константы a и b выбраны некоторым специальным образом.

Их выбирают такими, чтобы функция F(a,b)=M((Y–aX–b) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ) достигала в точке a, b минимума. Тогда в среднем квадратичном случайная величина aX+b будет менее всего уклоняться от Y.

Применив метод наименьших квадратов, найдем для a и b следующие значения:

a= ρ(X, Y) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru , b=MY – ρ(X, Y) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru MX

тогда F(a,b)=DY(1 – ρ(X, Y) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ).

1. Если ρ(X, Y)>0, то при увеличении одной из случайных величин другая также имеет тенденцию к увеличению.

2. Если ρ(X, Y) <0, то при увеличении одной из случайных величин другая также будет в среднем квадратичном возрастать.

3. Если ρ(X, Y)=0, то при любых a, b M((Y – aX – b) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru )≥DY. Следовательно, ни при каких a, b случайная величина aX+b не может в среднем квадратичном приблизить случайную величину Y лучше, чем константа MY(среднее значение Y).

4. Если –1< ρ(X, Y)<1, то при a,b M((Y–aX–b) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru )= DY(1 – ρ(X, Y) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ). Следовательно, случайная величина aX+b в среднем квадратичном лучше приближает Y, чем MY, причем тем лучше, чем больше ‌‌ Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ‌.

5. Если ρ(X, Y)=1 или ρ(X, Y)= –1, то равенство Y=aX+b выполняется с вероятностью 1.

Метод наименьших квадратов

Введем обозначения:

m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru =MX, m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru =MY, Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru =Cov(X,Y), Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru =DX, Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru =DY.

Пользуясь ими, вычисляем:

F(a,b)= M(Y – aX – b) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru =M((Y – m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ) – a(X – m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ) + (m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru – a m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru – b)) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru = Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru +a Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru –2a Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru +( m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru –a m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru – b) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru .

Исследуем функцию на экстремум. Сначала вычисляем ее частные производные и приравниваем их к нулю:

Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru (a,b)=2a Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru –2 Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru –2 m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ( m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru –a m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru –b)=0

Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru (a,b)=–2(m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru –a m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru –b)=0

Решая полученную систему линейных уравнений относительно a, b, получаем: a= Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru , b= m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ruПостановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru . Вычислим Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru F(a,b)=2( Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru + Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru )da Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru +4 m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru dadb+2db Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru =2 Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru da Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru +2(m Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru da+db) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru >0. Функция имеет единственную точку экстремума и в этой точке достигается минимум. Отметим, что выражению M(Y – aX – b) Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru можно придать такой смысл: это среднее значение суммы квадратов расстояний от прямой y=ax+b до значений случайной величины Y, причем расстояние измеряется вдоль оси OY.

Основные понятия математической статистики.

МС – наука, которая изучает вероятностные свойства ГС.

Генеральная совокупность (ГС) – совокупность объектов, из которых производится выборка.

Задача МС : изучить вероятн-ые свойства генеральной совокупности.

Выборка – совокупность,случайно отобранных объектов (выборочная совокупность).

Числа выборки, упорядоченные по возрастанию,образуют вариационный ряд:

X Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ≤ X Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ≤ …≤ X Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru

Статистики вида:

Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru

называются соответственно выборочным средним и выборочной дисперсией.

Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru – несмещенная оценка DX (исправленная выборочная дисперсия)

Статистическая оценка – любая функция от выборки. Свойства статистической оценки:

1. Несмещенность

2. Состоятельность

3. Эффективность

Теорема: Оценки Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru и Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru – несмещенные, а оценка Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru – состоятельная.

Доказательство: Сначала докажем несмещенность оценок. Нужно проверить, что M Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru =a, M Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ruПостановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru .

По определению имеем

Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru M Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru =M Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru = Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru =a.

Далее,

M Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru = Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru , где Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru

Выполним тождественные преобразования:

Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru = Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru = Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru = Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru

Далее воспользуемся тем, что MX Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru = σ Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru +a Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru , и при Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru M (X Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru X Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru )=MX Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ·MX Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ( случайные величины X Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru и X Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru независимы)

Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru = Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru σ Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru +a Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru )– Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru =(1– Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru ) σ Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru , то есть M Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ruПостановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru .

Докажем состоятельность оценки Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru . Для этого вычислим D Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru :

D Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru = Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru → 0.

Если D Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru и M Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru → 0, то Постановка и решение задачи линейной регрессии. Метод наименьших квадратов - student2.ru – состоятельная оценка параметра x.


Наши рекомендации