Оценка существенности параметров линейной регрессии и корреляции

После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.

Оценка значимости уравнения регрессии в целом дается с помощью оценка существенности параметров линейной регрессии и корреляции - student2.ru -критерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен нулю, т. е. оценка существенности параметров линейной регрессии и корреляции - student2.ru , и, следовательно, фактор оценка существенности параметров линейной регрессии и корреляции - student2.ru не оказывает влияния на результат оценка существенности параметров линейной регрессии и корреляции - student2.ru .

Непосредственному расчету оценка существенности параметров линейной регрессии и корреляции - student2.ru -критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной оценка существенности параметров линейной регрессии и корреляции - student2.ru от среднего значения оценка существенности параметров линейной регрессии и корреляции - student2.ru на две части – «объясненную» и «необъясненную»:

оценка существенности параметров линейной регрессии и корреляции - student2.ru

Общая сумма квадратов отклонений индивидуальных значений результативного признака оценка существенности параметров линейной регрессии и корреляции - student2.ru от среднего значения оценка существенности параметров линейной регрессии и корреляции - student2.ru вызвана влиянием множества причин. Условно разделим всю совокупность причин на две группы: изучаемый фактор оценка существенности параметров линейной регрессии и корреляции - student2.ru и прочие факторы. Если фактор не оказывает влияния на результат, то линия регрессии на графике параллельна оси оценка существенности параметров линейной регрессии и корреляции - student2.ru и оценка существенности параметров линейной регрессии и корреляции - student2.ru . Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадет с остаточной. Если же прочие факторы не влияют на результат, то оценка существенности параметров линейной регрессии и корреляции - student2.ru связан с оценка существенности параметров линейной регрессии и корреляции - student2.ru функционально, и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов.

Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс как обусловленный влиянием фактора оценка существенности параметров линейной регрессии и корреляции - student2.ru , т. е. регрессией оценка существенности параметров линейной регрессии и корреляции - student2.ru по оценка существенности параметров линейной регрессии и корреляции - student2.ru , так и вызванный действием прочих причин (необъясненная вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию. Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор оценка существенности параметров линейной регрессии и корреляции - student2.ru оказывает существенное воздействие на результат у. Это равносильно тому, что коэффициент детерминации оценка существенности параметров линейной регрессии и корреляции - student2.ru будет приближаться к единице.

Любая сумма квадратов отклонений связана с числом степеней свободы (df– degrees of freedom), т.е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности оценка существенности параметров линейной регрессии и корреляции - student2.ru и с числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показать, сколько независимых отклонений от средней из оценка существенности параметров линейной регрессии и корреляции - student2.ru возможных требуется для образования данной суммы квадратов. Так, для общей суммы квадратов оценка существенности параметров линейной регрессии и корреляции - student2.ru независимых отклонений, ибо по совокупности из оценка существенности параметров линейной регрессии и корреляции - student2.ru единиц после расчета среднего уровня свободно варьируют лишь оценка существенности параметров линейной регрессии и корреляции - student2.ru число отклонений. Например, имеем ряд значений у: 1,2, 3, 4, 5. Среднее из них равно 3, и тогда отклонения от среднего составят: –2; –1; 0; 1; 2. Так как оценка существенности параметров линейной регрессии и корреляции - student2.ru , то свободно варьируют лишь четыре отклонения, а пятое отклонение может быть определено, если предыдущие четыре известны.

При расчете объясненной или факторной суммы квадратов оценка существенности параметров линейной регрессии и корреляции - student2.ru используются теоретические (расчетные) значения результативного признака оценка существенности параметров линейной регрессии и корреляции - student2.ru , найденные по уравнению линейной регрессии.

Величина оценка существенности параметров линейной регрессии и корреляции - student2.ru определяется по уравнению линейной регрессии оценка существенности параметров линейной регрессии и корреляции - student2.ru . Параметр оценка существенности параметров линейной регрессии и корреляции - student2.ru можно найти как оценка существенности параметров линейной регрессии и корреляции - student2.ru , тогда, подставив оценка существенности параметров линейной регрессии и корреляции - student2.ru в линейную модель, получим:

оценка существенности параметров линейной регрессии и корреляции - student2.ru .

Отсюда видно, что при заданном наборе переменных оценка существенности параметров линейной регрессии и корреляции - student2.ru и оценка существенности параметров линейной регрессии и корреляции - student2.ru расчетное значение оценка существенности параметров линейной регрессии и корреляции - student2.ru является в линейной регрессии функцией только одного параметра – коэффициента регрессии. Соответственно и факторная сумма квадратов отклонений имеет число степеней свободы, равное 1.

Существует равенство между числом степеней свободы общей, факторной и остаточной суммами квадратов.

Число степеней свободы остаточной суммы квадратов при линейной регрессии составляет оценка существенности параметров линейной регрессии и корреляции - student2.ru . Число степеней свободы для общей суммы определяется числом единиц, и поскольку мы используем среднюю вычисленную по данным выборки, то теряем одну степень свободы, т.е. оценка существенности параметров линейной регрессии и корреляции - student2.ru .

Итак, имеем два равенства:

оценка существенности параметров линейной регрессии и корреляции - student2.ru

Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений, или, что то же самое, дисперсию на одну степень свободы D.

оценка существенности параметров линейной регрессии и корреляции - student2.ru ;

оценка существенности параметров линейной регрессии и корреляции - student2.ru ;

оценка существенности параметров линейной регрессии и корреляции - student2.ru .

Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-отношения, (F-критерий):

оценка существенности параметров линейной регрессии и корреляции - student2.ru ,

где F – критерий для проверки нулевой гипотезы.

Если нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для оценка существенности параметров линейной регрессии и корреляции - student2.ru необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений F-отношений при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия – это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение оценка существенности параметров линейной регрессии и корреляции - student2.ru –отношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: оценка существенности параметров линейной регрессии и корреляции - student2.ru оценка существенности параметров линейной регрессии и корреляции - student2.ru оценка существенности параметров линейной регрессии и корреляции - student2.ru отклоняется.

Если же величина окажется меньше табличной оценка существенности параметров линейной регрессии и корреляции - student2.ru , то вероятность нулевой гипотезы выше заданного уровня (например, 0,05) и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. оценка существенности параметров линейной регрессии и корреляции - student2.ru не отклоняется.

Величина F-критерия связана с коэффициентом детерминации оценка существенности параметров линейной регрессии и корреляции - student2.ru . Факторную сумму квадратов отклонений можно представить как

оценка существенности параметров линейной регрессии и корреляции - student2.ru ,

а остаточную сумму квадратов – как

оценка существенности параметров линейной регрессии и корреляции - student2.ru

Тогда значение оценка существенности параметров линейной регрессии и корреляции - student2.ru -критерия можно выразить как

оценка существенности параметров линейной регрессии и корреляции - student2.ru

Оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа.

В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: оценка существенности параметров линейной регрессии и корреляции - student2.ru и оценка существенности параметров линейной регрессии и корреляции - student2.ru .

Стандартная ошибка коэффициента регрессии определяется по формуле

оценка существенности параметров линейной регрессии и корреляции - student2.ru

где оценка существенности параметров линейной регрессии и корреляции - student2.ru – остаточная дисперсия на одну степень свободы.

Величина стандартной ошибки совместно с оценка существенности параметров линейной регрессии и корреляции - student2.ru -распределением Стьюдента при оценка существенности параметров линейной регрессии и корреляции - student2.ru степенях свободы применяется для проверки существенности коэффициента регрессии и для расчета его доверительных интервалов.

Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т. е. определяется фактическое значение оценка существенности параметров линейной регрессии и корреляции - student2.ru -критерия Стьюдента: оценка существенности параметров линейной регрессии и корреляции - student2.ru , которое затем сравнивается с табличным значением при определенном уровне значимости оценка существенности параметров линейной регрессии и корреляции - student2.ru и числе степеней свободы оценка существенности параметров линейной регрессии и корреляции - student2.ru .

Этот же результат получим, извлекая квадратный корень из найденного ранее оценка существенности параметров линейной регрессии и корреляции - student2.ru -критерия, т. е.

оценка существенности параметров линейной регрессии и корреляции - student2.ru .

Доверительный интервал для коэффициента регрессии определяется как оценка существенности параметров линейной регрессии и корреляции - student2.ru .

Поскольку коэффициент регрессии в эконометрических исследованиях имеет четкую экономическую интерпретацию, то доверительные границы интервала для коэффициента регрессии не должны содержать противоречивых результатов, например, оценка существенности параметров линейной регрессии и корреляции - student2.ru . Такого рода запись указывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже ноль, чего не может быть.

Стандартная ошибка параметра а определяется по формуле:

оценка существенности параметров линейной регрессии и корреляции - student2.ru

Процедура оценивания существенности данного параметра не отличается от рассмотренной выше для коэффициента регрессии; вычисляется оценка существенности параметров линейной регрессии и корреляции - student2.ru -критерий: оценка существенности параметров линейной регрессии и корреляции - student2.ru , его величина сравнивается с табличным значением при оценка существенности параметров линейной регрессии и корреляции - student2.ru степенях свободы.

Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции оценка существенности параметров линейной регрессии и корреляции - student2.ru

оценка существенности параметров линейной регрессии и корреляции - student2.ru

Фактическое значение оценка существенности параметров линейной регрессии и корреляции - student2.ru -критерия Стьюдента определяется как

оценка существенности параметров линейной регрессии и корреляции - student2.ru

Данная формула свидетельствует, что в парной линейной регрессии оценка существенности параметров линейной регрессии и корреляции - student2.ru , ибо, как уже указывалось, оценка существенности параметров линейной регрессии и корреляции - student2.ru . Кроме того, оценка существенности параметров линейной регрессии и корреляции - student2.ru . Следовательно, оценка существенности параметров линейной регрессии и корреляции - student2.ru .

Таким образом, проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.

Наши рекомендации