В парной линейной зависимости

Пусть даны признаки Х и У, которыми обладают элементы генеральной совокупности. Предполагаем, что они имеют совместное нормальное распределение. Чтобы изучить взаимосвязь между признаками, проведем выборку объемом n из двухмерной генеральной совокупности. В результате получим эмпирические данные:

хi х1 х2 ... хn
yi y1 y2 ... yn .

Построим точки с координатами (хi, уi), или корреляционное поле (рис. 4). Пусть по расположению построенных точек видно, что зависимость между X и Y близка к линейной: у=а01х. Построим график этой зависимости.

В парной линейной зависимости - student2.ru

Рис. 4

Эмпирические значения В парной линейной зависимости - student2.ru соответствуют ординатам точек корреляционного поля на рис. 4; теоретические (расчетные) значения признака У найдены по уравнению В парной линейной зависимости - student2.ru и соответствуют ординатам точек с абсциссами хi, лежащих на прямой. На рис. 4 также показаны отклонения В парной линейной зависимости - student2.ru эмпирических значений признака В парной линейной зависимости - student2.ru от расчетных В парной линейной зависимости - student2.ru . Обобщаемым показателем рассеяния эмпирических точек вокруг прямой будет сумма квадратов отклонений В парной линейной зависимости - student2.ru , то есть

В парной линейной зависимости - student2.ru .

Чем меньше величина S, тем лучше прямая В парной линейной зависимости - student2.ru "подогнана" к точкам (хi, уi) корреляционного поля.

Необходимым условием существования минимума функции В парной линейной зависимости - student2.ru является равенство нулю одновременно всех ее частных производных.

Воспользуемся этим условием и получим следующую систему уравнений:

В парной линейной зависимости - student2.ru или В парной линейной зависимости - student2.ru

Преобразуем эту систему:

В парной линейной зависимости - student2.ru

Полученную систему еще можно упростить, поделив обе части каждого уравнения на n. Система примет следующий вид:

В парной линейной зависимости - student2.ru

Эту систему называют системой нормальных уравнений. Система нормальных уравнений состоит из двух линейных уравнений с двумя неизвестными а0, а1.

Решая эту систему, например, методом Крамера, находим а0, а1.

В парной линейной зависимости - student2.ru , В парной линейной зависимости - student2.ru , В парной линейной зависимости - student2.ru

Коэффициент а1 называют коэффициентом регрессии у на х.

Коэффициенты а0, а1, вычисленные из системы нормальных уравнений, являются оценками истинных значений параметров регрессии.

Полученное уравнение регрессии В парной линейной зависимости - student2.ru называют эмпирическим уравнением регрессии. Преобразуем его. Подставим в это уравнение значение В парной линейной зависимости - student2.ru из первого уравнения системы нормальных уравнений:

В парной линейной зависимости - student2.ru или В парной линейной зависимости - student2.ru

Уравнение регрессии в этой форме часто применяется на практике. Из данного уравнения мы можем выявить экономический смысл параметра а1, который показывает, как изменяется в среднем результативный признак У, если факторный признак Х увеличится на единицу своего измерения.

Таким образом, по уравнению регрессии мы можем выяснить, как изменяется в среднем результативный признак (У) с изменением факторного признака (Х). Кроме того, уравнение регрессии приближенно выражает в виде функции корреляционную зависимость между признаками, и по нему можно прогнозировать значения результативного признака.

Корреляционный анализ

Наши рекомендации