Отыскание параметров уравнения прямой регрессии

Рассмотрим корреляционную таблицу в общем виде.

Таблица 6. Общий вид корреляционной таблицы

xi yi x1 x2 ..... xi ....... xs итого nyj
y1 n11 n12 ..... n1i ...... n1s ny1
y2 n21 n22 ..... n2i ...... n2s ny2
....... ........ ......... ........ ........... .......... ............ .........
yj nj1 nj2 ....... nji ....... njs nyj
............. .......... .......... ......... ........... .......... .......... ...........
yt nt1 nt2 ....... nti ........ nts nyt
Итого nxi Средние Отыскание параметров уравнения прямой регрессии - student2.ru nx1   Отыскание параметров уравнения прямой регрессии - student2.ru nx2   Отыскание параметров уравнения прямой регрессии - student2.ru ……   …… nxi   ….. ……   …… nxs   Отыскание параметров уравнения прямой регрессии - student2.ru Отыскание параметров уравнения прямой регрессии - student2.ru

Как видно из примеров , некоторые клетки таблицы могут оказаться пустыми, - в таких случаях считаем, что соответствующие частоты Отыскание параметров уравнения прямой регрессии - student2.ru равны нулю. В таблице 6. Отыскание параметров уравнения прямой регрессии - student2.ru - частоты соответствующих пар переменных Отыскание параметров уравнения прямой регрессии - student2.ru . Сумма всех частот дает объем совокупности n:

Отыскание параметров уравнения прямой регрессии - student2.ru (9)

при этом

Отыскание параметров уравнения прямой регрессии - student2.ru (10)

Из корреляционной таблицы видно, что признак Х принимает значение Отыскание параметров уравнения прямой регрессии - student2.ru с частотой Отыскание параметров уравнения прямой регрессии - student2.ru , значение Отыскание параметров уравнения прямой регрессии - student2.ru с частотой Отыскание параметров уравнения прямой регрессии - student2.ru и т.д., следовательно, общая средняя Отыскание параметров уравнения прямой регрессии - student2.ru признака Х вычисляется по формуле:

Отыскание параметров уравнения прямой регрессии - student2.ru (11)

Аналогично вычисляется общая средняя Отыскание параметров уравнения прямой регрессии - student2.ru признака Y:

Отыскание параметров уравнения прямой регрессии - student2.ru . (12)

Условные средние Отыскание параметров уравнения прямой регрессии - student2.ru находятся следующим образом:

Отыскание параметров уравнения прямой регрессии - student2.ru . (13)

Ранее уже было сказано о построении корреляционного поля, т.е. точек с координатами Отыскание параметров уравнения прямой регрессии - student2.ru . Предположим, что мы по виду корреляционного поля пришли к выводу о существовании между значениями признаков Х и Y линейной корреляционной зависимости:

Отыскание параметров уравнения прямой регрессии - student2.ru . (14)

Естественное желание состоит в том, чтобы параметры Отыскание параметров уравнения прямой регрессии - student2.ru и Отыскание параметров уравнения прямой регрессии - student2.ru этой функции подобрать так, чтобы суммарное отклонение точек корреляционного поля от прямой было наименьшим. Действительно, если в уравнение (14) последовательно подставлять значения признака Х, то будем получать значения признака Y, которые назовем теоретическими: Отыскание параметров уравнения прямой регрессии - student2.ru . Разумеется, теоретические значения Отыскание параметров уравнения прямой регрессии - student2.ru , как правило, отличаются от фактических Отыскание параметров уравнения прямой регрессии - student2.ru . Математическая задача ставится следующим образом: параметры Отыскание параметров уравнения прямой регрессии - student2.ru и Отыскание параметров уравнения прямой регрессии - student2.ru уравнения прямой регрессии Отыскание параметров уравнения прямой регрессии - student2.ru выбираются такими, чтобы функция Отыскание параметров уравнения прямой регрессии - student2.ru принимала наименьшее значение. Заметим, что последняя формула учитывает «вес» Отыскание параметров уравнения прямой регрессии - student2.ru каждой точки Отыскание параметров уравнения прямой регрессии - student2.ru , т.е. общее число наблюдений, по которым рассчитывалась соответствующая средняя Отыскание параметров уравнения прямой регрессии - student2.ru и, таким образом, каждая пара Отыскание параметров уравнения прямой регрессии - student2.ru учитывается столько раз, сколько раз она наблюдается в корреляционной таблице. Указанный метод определения параметров уравнения регрессии называется методом наименьших квадратов (МНК).

Итак, функцию двух переменных Отыскание параметров уравнения прямой регрессии - student2.ru требуется исследовать на экстремум (минимум). Для этого находим частные производные этой функции и приравнивая их к нулю, получаем так называемую систему нормальных уравнений для определения Отыскание параметров уравнения прямой регрессии - student2.ru и Отыскание параметров уравнения прямой регрессии - student2.ru :

Отыскание параметров уравнения прямой регрессии - student2.ru (15)

Сокращая все члены уравнений на 2 и группируя члены, содержащие Отыскание параметров уравнения прямой регрессии - student2.ru Отыскание параметров уравнения прямой регрессии - student2.ru и Отыскание параметров уравнения прямой регрессии - student2.ru , получим:

Отыскание параметров уравнения прямой регрессии - student2.ru (16)

Поделив все члены уравнений на общее число наблюдений n, преобразуем систему к виду:

Отыскание параметров уравнения прямой регрессии - student2.ru (17)

Систему (17) можно записать в более компактном виде, если учесть некоторые соотношения, вытекающие из корреляционной таблицы 6. Действительно, соотношения 9 - 13 показывают, что коэффициент при Отыскание параметров уравнения прямой регрессии - student2.ru во втором уравнении равен единице. Кроме этого, коэффициент при Отыскание параметров уравнения прямой регрессии - student2.ru в первом уравнении и коэффициент при Отыскание параметров уравнения прямой регрессии - student2.ru во втором равны Отыскание параметров уравнения прямой регрессии - student2.ru . Коэффициент при Отыскание параметров уравнения прямой регрессии - student2.ru в первом уравнении представляет собой среднюю арифметическую квадратов значений признака Х, и поэтому обозначается Отыскание параметров уравнения прямой регрессии - student2.ru . Преобразуем свободный член второго уравнения и получим, что свободный член второго уравнения равен Отыскание параметров уравнения прямой регрессии - student2.ru .

Наконец, доказывается, что свободный член первого уравнения системы равен средней арифметической произведений значений признаков Х и Y которую обозначим Отыскание параметров уравнения прямой регрессии - student2.ru . В результате этих преобразований и обозначений система (17) принимает вид

Отыскание параметров уравнения прямой регрессии - student2.ru . (18)

Из второго уравнения этой системы находим Отыскание параметров уравнения прямой регрессии - student2.ru и подставляем в уравнение регрессии . В результате этого уравнение прямой регрессии получаем в виде: Отыскание параметров уравнения прямой регрессии - student2.ru , который показывает, что прямая регрессии проходит через точку Отыскание параметров уравнения прямой регрессии - student2.ru . Коэффициент Отыскание параметров уравнения прямой регрессии - student2.ru обычно обозначают Отыскание параметров уравнения прямой регрессии - student2.ru и назы -вают коэффициентом регрессии Отыскание параметров уравнения прямой регрессии - student2.ru на Отыскание параметров уравнения прямой регрессии - student2.ru , поэтому уравнение будем писать в виде

Отыскание параметров уравнения прямой регрессии - student2.ru (19)

Коэффициент регрессии находим, решая до конца систему (18).

Например, умножим второе уравнение на Отыскание параметров уравнения прямой регрессии - student2.ru и сложим с первым. Получим Отыскание параметров уравнения прямой регрессии - student2.ru , откуда Отыскание параметров уравнения прямой регрессии - student2.ru . Итак, окончательные итоги таковы: уравнение прямой регрессии Отыскание параметров уравнения прямой регрессии - student2.ru на Отыскание параметров уравнения прямой регрессии - student2.ru имеет вид:

Отыскание параметров уравнения прямой регрессии - student2.ru ,

коэффициент регрессии Отыскание параметров уравнения прямой регрессии - student2.ru находится по формуле

Отыскание параметров уравнения прямой регрессии - student2.ru ,

где: Отыскание параметров уравнения прямой регрессии - student2.ru

Наши рекомендации