Вывод выражения для функции регрессии

В прикладных задачах теории вероятностей часто возникает необходимость оценки значения реализации Вывод выражения для функции регрессии - student2.ru одной случайной величины Вывод выражения для функции регрессии - student2.ru (ненаблюдаемой) по значению реализации Вывод выражения для функции регрессии - student2.ru (по выборочному значению) другой случайной величины Вывод выражения для функции регрессии - student2.ru (наблюдаемой). Оценка имеет смысл только в том случае, когда случайные величины Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru статистически зависимы, т.е. закон распределения случайной величины Вывод выражения для функции регрессии - student2.ru зависит от значения реализации Вывод выражения для функции регрессии - student2.ru случайной величины Вывод выражения для функции регрессии - student2.ru ( Вывод выражения для функции регрессии - student2.ru ). Поскольку закон распределения Вывод выражения для функции регрессии - student2.ru полностью определяется комплексом условий D эксперимента, то величина Вывод выражения для функции регрессии - student2.ru должна быть параметром этого комплекса условий или так или иначе влиять на него. Условную плотность вероятностей Вывод выражения для функции регрессии - student2.ru можно рассматривать как формальную математическую модель зависимости, которая отражает влияние значения Вывод выражения для функции регрессии - student2.ru на вероятность появления Вывод выражения для функции регрессии - student2.ru через комплекс условий D.

В качестве оценки значения Вывод выражения для функции регрессии - student2.ru выбирается значение Вывод выражения для функции регрессии - student2.ru некоторой функции Вывод выражения для функции регрессии - student2.ru , вид которой определяет качество оценки. При отдельном наблюдении ошибка равна Вывод выражения для функции регрессии - student2.ru . При многократном наблюдении одного и того же значения Вывод выражения для функции регрессии - student2.ru случайная величина Вывод выражения для функции регрессии - student2.ru , закон распределения которой Вывод выражения для функции регрессии - student2.ru зависит от Вывод выражения для функции регрессии - student2.ru , будет принимать разные значения, то есть ошибка Вывод выражения для функции регрессии - student2.ru будет случайной величиной, средний квадрат Вывод выражения для функции регрессии - student2.ru которой можно выбрать в качестве критерия качества оценки:

Вывод выражения для функции регрессии - student2.ru (1.1)

Поскольку среднеквадратическая ошибка Вывод выражения для функции регрессии - student2.ru зависит от значения Вывод выражения для функции регрессии - student2.ru , то ее можно назвать условной. В качестве критерия чаще используется безусловная среднеквадратическая ошибка, которая получается в результате статистического усреднения Вывод выражения для функции регрессии - student2.ru по всем значениям Вывод выражения для функции регрессии - student2.ru :

Вывод выражения для функции регрессии - student2.ru ,

причем Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru .

Докажем, что Вывод выражения для функции регрессии - student2.ru минимальна, когда функция Вывод выражения для функции регрессии - student2.ru совпадает с условным средним значением случайной величины Вывод выражения для функции регрессии - student2.ru :

Вывод выражения для функции регрессии - student2.ru

Поскольку Вывод выражения для функции регрессии - student2.ru , то Вывод выражения для функции регрессии - student2.ru будет минимальна, если Вывод выражения для функции регрессии - student2.ru будет минимальна при каждом Вывод выражения для функции регрессии - student2.ru . Преобразуя (1.1) при заданном значении Вывод выражения для функции регрессии - student2.ru , получим:

Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru =

Вывод выражения для функции регрессии - student2.ru + Вывод выражения для функции регрессии - student2.ru +2 Вывод выражения для функции регрессии - student2.ru ( Вывод выражения для функции регрессии - student2.ru ).

Сомножитель Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru =0, и поэтому третье слагаемое равно нулю. Поскольку от Вывод выражения для функции регрессии - student2.ru зависит только второе слагаемое и оно неотрицательно, то минимум суммы достигается при Вывод выражения для функции регрессии - student2.ru , т.е., когда второй член равен 0.

Условное среднее значение случайной величины Вывод выражения для функции регрессии - student2.ru при Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru , ( Вывод выражения для функции регрессии - student2.ru ), рассматриваемое как функция переменного Вывод выражения для функции регрессии - student2.ru , называется функцией регрессии Вывод выражения для функции регрессии - student2.ru

Функция регрессии отражает зависимость одного из параметров (среднего значения) закона распределения случайной величины Вывод выражения для функции регрессии - student2.ru от значения Вывод выражения для функции регрессии - student2.ru (реализация) случайной величины Вывод выражения для функции регрессии - student2.ru . Если зависимость среднего значения от Вывод выражения для функции регрессии - student2.ru отсутствует, то это еще не значит, что случайные величины Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru независимы – в общем случае от Вывод выражения для функции регрессии - student2.ru может зависеть не только среднее значение, но и другие параметры распределения. Если же случайные величины Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru независимы, то и каждый параметр распределения Вывод выражения для функции регрессии - student2.ru не будет зависеть от Вывод выражения для функции регрессии - student2.ru , то есть форма функции распределения Вывод выражения для функции регрессии - student2.ru не будет зависеть от Вывод выражения для функции регрессии - student2.ru

Линейная функция регрессия.

В некоторых случаях вводится ограничение на вид возможных функций Вывод выражения для функции регрессии - student2.ru , например, ограничиваются классом линейных функций Вывод выражения для функции регрессии - student2.ru , которые записываются в виде Вывод выражения для функции регрессии - student2.ru + Вывод выражения для функции регрессии - student2.ru . Выбор оптимальной функции из этого класса, т.е. той, которая дает оценку с минимальной среднеквадратической ошибкой, сводится к определению коэффициентов Вывод выражения для функции регрессии - student2.ru .

Функция Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru + Вывод выражения для функции регрессии - student2.ru , для которой среднеквадратическая ошибка

Вывод выражения для функции регрессии - student2.ru

минимальна, называется функцией линейной регрессии, а соответствующие коэффициенты Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru – коэффициентами регрессии.

Обозначив через Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru средние значения случайных величин Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru , коэффициенты регрессии можно определить, если сделать следующие тождественные преобразования:

Вывод выражения для функции регрессии - student2.ru

Вывод выражения для функции регрессии - student2.ru , где Вывод выражения для функции регрессии - student2.ru Вывод выражения для функции регрессии - student2.ru , Вывод выражения для функции регрессии - student2.ru , Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru - центрированные случайные величины.

Тогда Вывод выражения для функции регрессии - student2.ru , (1.2)

где Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru по определению дисперсии случайных величин Вывод выражения для функции регрессии - student2.ru , Вывод выражения для функции регрессии - student2.ru как среднее значение от центрированных случайных величин.

Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru

среднее от произведения двух центрированных случайных величин Вывод выражения для функции регрессии - student2.ru называется корреляцией между этими случайными величинами. Иногда удобнее использовать коэффициент корреляции r = Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru , который определяется как среднее значение от произведения центрированных и нормированных случайных величин Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru .

С учетом введенных обозначений можно произвести следующие тождественные преобразования выражения (1.2):

Вывод выражения для функции регрессии - student2.ru

Отсюда следует, что минимум среднеквадратической ошибки, равный Вывод выражения для функции регрессии - student2.ru

достигается при тех значениях Вывод выражения для функции регрессии - student2.ru , при которых последние два слагаемых (неотрицательные) равны нулю:

Вывод выражения для функции регрессии - student2.ru

Вывод выражения для функции регрессии - student2.ru

Решая эту систему уравнений, получим:

Вывод выражения для функции регрессии - student2.ru ; Вывод выражения для функции регрессии - student2.ru

Соответствующая функция линейной регрессии имеет вид:

Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru ( Вывод выражения для функции регрессии - student2.ru ) (1.3)

C целью наглядности геометрической интерпретации последнее равенство можно представить в виде:

Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru ( Вывод выражения для функции регрессии - student2.ru ) (1.4)

или

Вывод выражения для функции регрессии - student2.ru (1.5)

Для построения функции линейной регрессии достаточно знать только средние значения, дисперсии случайных величин Вывод выражения для функции регрессии - student2.ru , Вывод выражения для функции регрессии - student2.ru и их коэффициент корреляции, который равен тангенсу угла наклона прямой, определяемой выражением (1.5), если по осям откладывать соответственно значения Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru .

Вывод выражения для функции регрессии - student2.ru

Рис. 1.19. Линейная функция регрессии, tg Вывод выражения для функции регрессии - student2.ru = r

Следует отметить, что в общем случае, то есть для произвольной плотности Вывод выражения для функции регрессии - student2.ru . Функция линейной регрессии (1.9) может не совпадать с действительной функцией регрессии m( Вывод выражения для функции регрессии - student2.ru ), поскольку условное среднее m( Вывод выражения для функции регрессии - student2.ru ) может быть нелинейной функцией.

Поэтому, если r=0 , то говорят, что между Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru отсутствует линейная зависимость, но это еще не значит, что между условным средним значением случайной величины Вывод выражения для функции регрессии - student2.ru и значением Вывод выражения для функции регрессии - student2.ru вообще отсутствует какая-либо зависимость.

Пример. Рассмотрим классическую задачу измерения физической величины. До измерения физической величины обычно располагают некоторыми сведениями о ее значении, например, может быть известна область ее возможных значений и степень ожидания того или другого значения, которая характеризуется вероятностью. В рамках теории вероятностей измеряемая величина рассматривается как реализация случайной величины Вывод выражения для функции регрессии - student2.ru (ненаблюдаемой), априорная (до измерения) неопределенность которой ограничивается видом ее закона распределения Вывод выражения для функции регрессии - student2.ru с дисперсией Вывод выражения для функции регрессии - student2.ru и средним значением, равным Вывод выражения для функции регрессии - student2.ru Результат измерения рассматривается как реализация случайной величины (наблюдаемой) Вывод выражения для функции регрессии - student2.ru , где Δ – ошибка измерения с нулевым средним значением (Δ=0), которая представляет собой сумму двух независимых случайных величин Вывод выражения для функции регрессии - student2.ru и Δ и имеет дисперсию

Вывод выражения для функции регрессии - student2.ru

И среднее значение Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru .

Тогда корреляция между случайными величинами Вывод выражения для функции регрессии - student2.ru и Вывод выражения для функции регрессии - student2.ru равна

Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru ( Вывод выражения для функции регрессии - student2.ru )= Вывод выражения для функции регрессии - student2.ru

где Вывод выражения для функции регрессии - student2.ru , Вывод выражения для функции регрессии - student2.ru = 0.

Коэффициент корреляции

r = Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru

а равенство (1.9) запишется в виде

Вывод выражения для функции регрессии - student2.ru

или

Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru ( Вывод выражения для функции регрессии - student2.ru ).

Отсюда следует, что эффективная оценка Вывод выражения для функции регрессии - student2.ru значения измеряемой физической величины не совпадает с результатом измерения Вывод выражения для функции регрессии - student2.ru

Если дисперсия Вывод выражения для функции регрессии - student2.ru ошибки измерения(неопределенность результата измерения или апостериорная неопределенность) много меньше дисперсии Вывод выражения для функции регрессии - student2.ru , которая характеризует априорную неопределенность, то Вывод выражения для функции регрессии - student2.ru , а при Вывод выражения для функции регрессии - student2.ru оценка Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru , т.е. в этом случае результат измерения Вывод выражения для функции регрессии - student2.ru практически не несет информации о значении физической величины в дополнение к тому, что было о ней известно до измерения.

Минимальная среднеквадратическая ошибка равна

Вывод выражения для функции регрессии - student2.ru

Из этого равенства следует, что в случае полного отсутствия априорных сведений об измеряемой величине Вывод выражения для функции регрессии - student2.ru и, следовательно, Вывод выражения для функции регрессии - student2.ru . Когда же значение измеряемой величины заранее известно ( Вывод выражения для функции регрессии - student2.ru , Вывод выражения для функции регрессии - student2.ru нет необходимости производить измерение. Если дисперсия Вывод выражения для функции регрессии - student2.ru =0 (абсолютно точное измерение), то, Вывод выражения для функции регрессии - student2.ru , т.е. всю необходимую информацию о значении измеряемой величины доставляет результат измерения и поэтому априорными сведениями можно пренебречь.

Если Вывод выражения для функции регрессии - student2.ru , то Вывод выражения для функции регрессии - student2.ru , то есть результат измерения не доставляет какой-либо информации и неопределенность измеряемой величины определяется априорной дисперсией Вывод выражения для функции регрессии - student2.ru .

Интересно сравнить эту задачу с задачей предсказания результата измерения по известному значению измеряемой величины. По отношению к предыдущей задаче наблюдаемая и ненаблюдаемая величины поменяются местами и равенство (1.9) примет вид

Вывод выражения для функции регрессии - student2.ru ,

причем Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru . Коэффициент корреляции не изменится и будет равен r= Вывод выражения для функции регрессии - student2.ru

Отсюда следует, что Вывод выражения для функции регрессии - student2.ru = Вывод выражения для функции регрессии - student2.ru и ошибка предсказания

Вывод выражения для функции регрессии - student2.ru .

Таким образом, чтобы эффективно предсказать результат измерения, в качестве его оценки всегда следует брать истинное значение измеряемой величины. В заключение следует отметить, что при оценке ненаблюдаемой величины по критерию среднеквадратической ошибки используются не все априорные сведения, содержащиеся в ее законе распределения, а только ее дисперсия и среднее.

Наши рекомендации