Линейная модель парной регрессии и корреляции

Ввиду четкой экономической интерпретации параметров линейной регрессии, она нашла широкое применение при статистических методах обработки данных.

Построение линейной регрессии сводится к нахождению уравнения вида:

Линейная модель парной регрессии и корреляции - student2.ru или Линейная модель парной регрессии и корреляции - student2.ru .

Уравнение вида Линейная модель парной регрессии и корреляции - student2.ru позволяет по заданным значениям фактора Линейная модель парной регрессии и корреляции - student2.ru определять теоретические значения результативного признака Линейная модель парной регрессии и корреляции - student2.ru , при подставлении в него фактических значений фактора Линейная модель парной регрессии и корреляции - student2.ru .

Построение линейной регрессии сводится к оценке двух параметров Линейная модель парной регрессии и корреляции - student2.ru и Линейная модель парной регрессии и корреляции - student2.ru .

Классическим подходом к оценке параметров линейной регрессии является метод наименьших квадратов (МНК), позволяющий получать такие оценки параметров Линейная модель парной регрессии и корреляции - student2.ru и Линейная модель парной регрессии и корреляции - student2.ru , при которых сумма квадратов отклонений фактических значений результативного признака Линейная модель парной регрессии и корреляции - student2.ru от теоретических Линейная модель парной регрессии и корреляции - student2.ru становится минимальной Линейная модель парной регрессии и корреляции - student2.ru .

Чтобы определить минимум функции, необходимо вначале вычислить частные производные по каждому из параметров Линейная модель парной регрессии и корреляции - student2.ru и Линейная модель парной регрессии и корреляции - student2.ru , а затем приравнять их к нулю. Если обозначить Линейная модель парной регрессии и корреляции - student2.ru через Линейная модель парной регрессии и корреляции - student2.ru , тогда получают:

Линейная модель парной регрессии и корреляции - student2.ru .

Линейная модель парной регрессии и корреляции - student2.ru

После проведения несложных преобразований, получают нормальную систему линейных уравнений для оценки параметров Линейная модель парной регрессии и корреляции - student2.ru и Линейная модель парной регрессии и корреляции - student2.ru :

Линейная модель парной регрессии и корреляции - student2.ru (1.59)

При решении системы уравнений (1.59) определяют искомые оценки параметров Линейная модель парной регрессии и корреляции - student2.ru и Линейная модель парной регрессии и корреляции - student2.ru . Из решения системы (1.59) непосредственно получают следующие формулы:

Линейная модель парной регрессии и корреляции - student2.ru , Линейная модель парной регрессии и корреляции - student2.ru (1.60)

где Линейная модель парной регрессии и корреляции - student2.ru , Линейная модель парной регрессии и корреляции - student2.ru , Линейная модель парной регрессии и корреляции - student2.ru , Линейная модель парной регрессии и корреляции - student2.ru .

Параметр Линейная модель парной регрессии и корреляции - student2.ru - коэффициент регрессии, величина которого показывает среднее изменение признака-результата с изменением признака-фактора на одну единицу.

Параметр Линейная модель парной регрессии и корреляции - student2.ru - это значение Линейная модель парной регрессии и корреляции - student2.ru при Линейная модель парной регрессии и корреляции - student2.ru . Если факторный признак Линейная модель парной регрессии и корреляции - student2.ru не может иметь нулевого значения, то параметр Линейная модель парной регрессии и корреляции - student2.ru не может иметь экономического содержания.

Нахождение уравнения регрессии всегда дополняют расчетом показателя тесноты связи. При использовании линейной регрессии в качестве такого показателя используют линейный коэффициент корреляции Линейная модель парной регрессии и корреляции - student2.ru , который рассчитывается на основании следующей формулы:

Линейная модель парной регрессии и корреляции - student2.ru , (1.61)

где Линейная модель парной регрессии и корреляции - student2.ru , Линейная модель парной регрессии и корреляции - student2.ru

Значение линейного коэффициента корреляции может находиться в пределах: Линейная модель парной регрессии и корреляции - student2.ru . Чем ближе абсолютное значение линейного коэффициента корреляции Линейная модель парной регрессии и корреляции - student2.ru к единице, тем сильнее линейная связь между двумя факторами (при Линейная модель парной регрессии и корреляции - student2.ru имеется строгая функциональная зависимость). Однако, следует учитывать, что близость абсолютной величины линейного коэффициента корреляции к нулю может не означать отсутствие связи между двумя признаками - при нелинейной спецификации модели связь между признаками может оказаться достаточно тесной.

Оценку тесноты линейной корреляционной связи принято определять, пользуясь данными табл. 1.11.

Таблица 1.11

Теснота связи Величина Линейная модель парной регрессии и корреляции - student2.ru
Прямая связь Обратная связь
Линейной связи нет Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru
Слабая Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru
Средняя Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru
Сильная Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru
Функциональная Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru

Для оценки качества подбора линейной функции рассчитывают коэффициент детерминации, представляющий собой квадрат линейного коэффициента корреляции Линейная модель парной регрессии и корреляции - student2.ru .

Коэффициент детерминации характеризует долю дисперсии признака-результата Линейная модель парной регрессии и корреляции - student2.ru , объясняемую регрессией, в общей дисперсии результативного признака. Определяется на основании формулы:

Линейная модель парной регрессии и корреляции - student2.ru , (1.62)

где Линейная модель парной регрессии и корреляции - student2.ru , Линейная модель парной регрессии и корреляции - student2.ru .

Величина Линейная модель парной регрессии и корреляции - student2.ru дает характеристику доли дисперсии Линейная модель парной регрессии и корреляции - student2.ru , вызванной влиянием остальных, не учтенных в модели, факторов.

После того как найдено уравнение линейной регрессии, проводят оценку значимости уравнения и отдельных его параметров.

Проверка значимости уравнения регрессии означает установление соответствия математической модели, выражающей зависимость между переменными, экспериментальным данным и достаточность включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.

Качество модели из относительных отклонений по каждому наблюдению определяют на основании средней ошибки аппроксимации, которая находится по формуле:

Линейная модель парной регрессии и корреляции - student2.ru . (1.63)

Средняя ошибка аппроксимации не должна превышать 8,0 - 10,0%.

Оценка значимости уравнения регрессии в целом проводится на основании Линейная модель парной регрессии и корреляции - student2.ru -критерия Фишера.

Согласно принципам дисперсионного анализа, общая сумма квадратов отклонений переменной Линейная модель парной регрессии и корреляции - student2.ru от среднего значения Линейная модель парной регрессии и корреляции - student2.ru раскладывается на две части – «объясненную» и «необъясненную»:

Линейная модель парной регрессии и корреляции - student2.ru , (1.64)

где Линейная модель парной регрессии и корреляции - student2.ru – общая сумма квадратов отклонений;

Линейная модель парной регрессии и корреляции - student2.ru – сумма квадратов отклонений, объясненная регрессией (или факторная сумма квадратов отклонений);

Линейная модель парной регрессии и корреляции - student2.ru – остаточная сумма квадратов отклонений, характеризующая влияние неучтенных в модели факторов.

Схема проведения дисперсионного анализа представлена в табл. 1.12.

Таблица 1.12

Компоненты дисперсии Сумма квадратов Число степеней свободы Дисперсия на одну степень свободы
Общая Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru
Факторная Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru
Остаточная Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru

Примечание: Линейная модель парной регрессии и корреляции - student2.ru – число наблюдений, Линейная модель парной регрессии и корреляции - student2.ru – число параметров при переменной Линейная модель парной регрессии и корреляции - student2.ru .

Величину Линейная модель парной регрессии и корреляции - student2.ru - критерия Фишера получают, сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы:

Линейная модель парной регрессии и корреляции - student2.ru . (1.65)

Расчетное значение Линейная модель парной регрессии и корреляции - student2.ru -критерия Фишера (1.65) сравнивают с табличным Линейная модель парной регрессии и корреляции - student2.ru при уровне значимости Линейная модель парной регрессии и корреляции - student2.ru и степенях свободы Линейная модель парной регрессии и корреляции - student2.ru и Линейная модель парной регрессии и корреляции - student2.ru (приложение 7). При этом, если фактическое значение Линейная модель парной регрессии и корреляции - student2.ru -критерия больше табличного, то признается статистическая значимость уравнения в целом.

Для парной линейной регрессии Линейная модель парной регрессии и корреляции - student2.ru , поэтому:

Линейная модель парной регрессии и корреляции - student2.ru . (1.66)

Величина Линейная модель парной регрессии и корреляции - student2.ru - критерия связана с коэффициентом детерминации Линейная модель парной регрессии и корреляции - student2.ru , и ее можно рассчитать по следующей формуле:

Линейная модель парной регрессии и корреляции - student2.ru . (1.67)

В парной линейной регрессии оценивается значимость также отдельных параметров уравнения.

Для оценки статистической значимости коэффициентов регрессии и корреляции определяют t-критерий Стьюдента и доверительные интервалы каждого из показателей. Оценку значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводят путем сопоставления их значений с величиной случайной ошибки:

Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru (1.68)

Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяют на основании формул:

Линейная модель парной регрессии и корреляции - student2.ru

Линейная модель парной регрессии и корреляции - student2.ru (1.69)

Линейная модель парной регрессии и корреляции - student2.ru

Для проверки существенности коэффициента регрессии и для расчета его доверительного интервала совместно с Линейная модель парной регрессии и корреляции - student2.ru -распределением Стьюдента при Линейная модель парной регрессии и корреляции - student2.ru степенях свободы применяют величину стандартной ошибки.

Для оценки существенности коэффициента регрессии определяют фактическое значение Линейная модель парной регрессии и корреляции - student2.ru -критерия Стьюдента, которое затем сравнивают с табличным значением при определенном уровне значимости Линейная модель парной регрессии и корреляции - student2.ru и числе степеней свободы Линейная модель парной регрессии и корреляции - student2.ru .

Если tтабл<tфак, то a, b и rxy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x. Если tтабл>tфак, то признается случайная природа формирования a, b или rxy.

Между Линейная модель парной регрессии и корреляции - student2.ru -критерием Стьюдента и Линейная модель парной регрессии и корреляции - student2.ru -критерием Фишера существует связь, определяемая:

Линейная модель парной регрессии и корреляции - student2.ru . (1.70)

Для расчета доверительного интервала определяется предельная ошибкаD для каждого из показателей: Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru

Для расчета доверительных интервалов используют формулы:

Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru

(1.71)

Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru Линейная модель парной регрессии и корреляции - student2.ru

В случае, если нижняя граница доверительного интервала отрицательна, а верхняя положительна, то оцениваемый параметр принимают равным нулю, так как он не может одновременно принимать и положительные, и отрицательные значения.

Наши рекомендации