Объясненная и необъясненная дисперсия результирующего показателя

Цель регрессионного анализа состоит в том, чтобы объяснить поведение переменной Ув зависимости от изменения выбранных факторов X1, Х2,…, Хn. В парном регрессионном анализе мы пытаемся объяснить поведение Упутем определения регрессионной зависимости У от фактораX. Для этой цели используется метод дисперсионного анализа.

Замечание: В математической статистике дисперсионный анализ рассматривается как самостоятельный метод статистического анализа. Мы же будем применять его как вспомогательное средство для изучения качества регрессионной модели.

Согласно основной идеи дисперсионного анализа общую сумму квадратов отклонений переменной у от среднего значения ӯ можно разложить на 2 части: объясненную и необъясненную:

Объясненная и необъясненная дисперсия результирующего показателя - student2.ru

Объясненная и необъясненная дисперсия результирующего показателя - student2.ru - общая сумма квадратов отклонений (TSS ),

Объясненная и необъясненная дисперсия результирующего показателя - student2.ru - объясненная или регрессионная сумма квадратов (ESS ),

Объясненная и необъясненная дисперсия результирующего показателя - student2.ru - необъясненная или остаточная сумма квадратов (RSS ).

TSS=ESS+RSS.

Общая сумма квадратов отклонений значения результативного показателя от среднего значения вызвано множеством причин. Условно разделим всю совокупность на 2 группы: влияние изучаемого фактораX и влияние прочих факторов. Если фактор X не влияет наУ, то линия регрессии параллельна оси ОХ (ŷ=ӯ), тогда вся дисперсия результативного показателя обусловлена воздействием прочих факторов. TSS= RSS.

Если же прочие факторы не влияют на результат, тоУ связан с X функционально и остаточная сумма квадратов отклонений отсутствует. TSS=ESS.

Поскольку не все точки корреляционного поля лежат на линии регрессии, то всегда имеется их разброс, обусловленный влиянием как фактора X, так и воздействием прочих причин. Пригодность линии регрессии для прогноза зависит от того какая часть общего отклонения показывается У приходится на объясненную часть. Очевидно, что если ESS>RSS, то уравнение регрессии статистически значимо и фактор X оказывает существенное влияние на результативный показательУ.

Любая сумма квадратов отклонений связана с числом степеней свободы. Число степеней свободы fзависит от объема выборки n и от числа определенных по этой выборке параметров к (для линейной модели к=2, т.к. ŷ =а+bх) можно показать, что для общей TSS число степеней свободы f1=n-1, для объясненной ESS - f2=к-1, для необъясненной RSS – f3=n-к.

TSS=ESS+RSS (4.1)

Разделив по членено каждое слагаемое равенства (4.1) на соответствующую ей степень свободы, получим средний квадрат отклонений или дисперсию на одну степень свободы.

Объясненная и необъясненная дисперсия результирующего показателя - student2.ru

Объясненная и необъясненная дисперсия результирующего показателя - student2.ru и Объясненная и необъясненная дисперсия результирующего показателя - student2.ru является несмещенными оценками дисперсии результирующего показателя обусловленных соответственно объясненной переменной х и под воздействием неучтенных случайных факторов.

Определение дисперсии на одну степень свободы приводит их к сравнимому виду и это используется в дальнейшем для проверки значимости влияния фактора х на результирующий показатель. (проверка фактора регрессии): для этого определяют:

Объясненная и необъясненная дисперсия результирующего показателя - student2.ru (4.2)

Величина F называется F-критерием (отношение) Фишера.

Наши рекомендации