Проверки существенности факторов и показатели качества регрессии
Практическая значимость множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата множественной детерминации. Показатель множ. корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком. Т.е. оценивает тесноту совместного влияния факторов на результат. Независимо от формы связи индекс множественной корреляции определяется по формуле:
Rу.Х1Х2…Хm=
общая дисперсия результативного признака
остаточная дисперсия
[0;1]
Чем ближе значение к 1, тем сильнее связь результативного признака со всем набором исследуемых факторов.
Rу.Х1Х2…Хm>rYXimax
Величина индекса множ. корреляции должна быть больше максимального значения парного коэф-та корреляции. При правильном включении фактора в модель величина индекса множ. корреляции будет существенно отличаться от коэф-та парной корреляции. Если в модель включены незначительные факторы, то эти коэф-ты будут практически одинаковыми, значит, сравнивая между собой эти коэф-ты, можно сделать вывод о целесообразности включения в модель того или иного фактора.ф-ла2
R.Х1Х2…Хm=1-
При линейной зависимости признаков индекс множ. корреляции можно найти след.образом: ф-ла 3
β - стандартизированные коэф-ты регрессии
rухi -парный коэф-т корреляции результата с каждым фактором
возможно также при линейной зависимости определять коэф-т корреляции через матрицу парных коэф-в корреляции. Ф-ла 4
∆r – определитель матрицы парных коэф-в корреляции
Матрица 1
∆r11 - определитель матрицы межфакторной корреляции
Матрица 2
В рассмотренных показателях корреляции используется остаточная дисперсия, имеющая систематическую ошибку тем более значительную, чем больше параметров определяется в уравнении регрессии при заданном объеме n. Если число параметров при факторе равно m и оно приближается к числу наблюдений, то остаточная дисперсия будет близка к 0 и коэф-т корреляции приблизится к 1 даже при слабой связи фактора с результатом. Для того чтобы не допустить преувеличения тесноты связи, используется скорректированный индекс множ. корреляции. Этот индекс содержит поправку на число степеней свободы. Остаточная сумма квадратов делится на число степеней свободы остаточной вариации, а общая сумма квадратов на число степеней свободы в целом по совокупности.
-cкорректированный коэф-т детерминации
Ф-ла 5
Чем больше величина m, тем сильнее различия между скорректированным и нескорректированным коэф-ми детерминации.
В этих же целях кроме рассмотренных факторов, чтобы ранжировать факторы по силе их воздействия на результат для линейных связей можно использовать частные коэф-ты корреляции. Частные коэф-ты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии. Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счёт дополнительного включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.
Запишем уравнение регрессии в общем виде:
у=а+b1x1+b2x2+…+bixi+…+bmxm
ф-ла 5
ry.XiX1X2…Хi-1X+-1…Xm=
для двухфакторной модели:
ryX1X2=
Порядок частного коэф-та корреляции определяется количеством факторов, влияние которых исключается.Коэф-ты корреляции более высоких порядков определяют через коэф-ты корреляции более низких порядков.
Частныйкоэф-т корреляции для двухфакторной модели: ф-ла 7
Ф-ла 8
Частные коэф-ты корреляции изменяются в пределах от -1 до 1 (рассчитанные по парным коэф-м корреляции). Если коэф-т корреляции рассчитан только по множественным коэф-м – изменяется от 0 до 1.
Сравнение частных коэф-в корреляции позволяет ранжировать факторы по тесноте их связи с результатом. Ранжирование совпадает со всеми рассмотренными с другими показателями.
Эти показатели рассматриваются только на стадии формирования в эконометрике.
Строя многофакторную модель, на 1ом шаге определяется уравнение регрессии с полным набором факторов, и рассчитывается матрица частных коэф-в корреляции. На 2ом шаге отбирается фактор с наименьшей и несущественной по t-критерию Стьюдента величиной частной корреляции. Исключив его из модели, строится новое уравнение регрессии. Процедура выполняется до тех пор, пока не окажется, что все частные коэф-ты корреляции существенно отличается от 0. Если исключен несущественный фактор, то множественные коэф-ты детерминации на 2х смежных шагах построения регрессионной модели практически не отличаются друг от друга. Ф-ла 9
Значимость уравнения множественной регрессии в целом так же, как и в парной оценивается с помощь F-критерия Фишера.
FФ= (R2/1-R2)(n-m-1/m)
Во множ. регрессии оценивается не только значимость уравнения в целом, но и значимость, может существенно увеличить долю объясненной вариации результативного признака. Кроме того, факторы могут вводиться в модель в различной последовательности. Ввиду корреляции между факторами значимости одного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой для оценки включения факторов в модель служит частный F-критерий FХi. Он построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительно включённого фактора с остаточной дисперсией на одну степень свободы по регрессионной модели. Ф-ла 10