И показатели качества регрессии

Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – показателя детерминации.

Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком или, иначе, оценивает тесноту совместного влияния факторов на результат.

Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:

И показатели качества регрессии - student2.ru , (2.12)

где И показатели качества регрессии - student2.ru – общая дисперсия результативного признака; И показатели качества регрессии - student2.ru – остаточная дисперсия.

Границы изменения индекса множественной корреляции от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов. Величина индекса множественной корреляции должна быть больше или равна максимальному парному индексу корреляции:

И показатели качества регрессии - student2.ru .

При правильном включении факторов в регрессионную модель величина индекса множественной корреляции будет существенно отличаться от индекса корреляции парной зависимости. Если же дополнительно включенные в уравнение множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции (различия в третьем, четвертом знаках). Отсюда ясно, что сравнивая индексы множественной и парной корреляции, можно сделать вывод о целесообразности включения в уравнение регрессии того или иного фактора.

Расчет индекса множественной корреляции предполагает определение уравнения множественной регрессии и на его основе остаточной дисперсии:

И показатели качества регрессии - student2.ru . (2.13)

Можно пользоваться следующей формулой индекса множественной детерминации:

И показатели качества регрессии - student2.ru . (2.14)

При линейной зависимости признаков формула индекса множественной корреляции может быть представлена следующим выражением:

И показатели качества регрессии - student2.ru , (2.15)

где И показатели качества регрессии - student2.ru – стандартизованные коэффициенты регрессии; И показатели качества регрессии - student2.ru – парные коэффициенты корреляции результата с каждым фактором.

Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции, или, что то же самое, совокупного коэффициента корреляции.

Возможно также при линейной зависимости определение совокупного коэффициента корреляции через матрицу парных коэффициентов корреляции:

И показатели качества регрессии - student2.ru , (2.16)

где

И показатели качества регрессии - student2.ru

– определитель матрицы парных коэффициентов корреляции;

И показатели качества регрессии - student2.ru

– определитель матрицы межфакторной корреляции.

Как видим, величина множественного коэффициента корреляции зависит не только от корреляции результата с каждым из факторов, но и от межфакторной корреляции. Рассмотренная формула позволяет определять совокупный коэффициент корреляции, не обращаясь при этом к уравнению множественной регрессии, а используя лишь парные коэффициенты корреляции.

В рассмотренных показателях множественной корреляции (индекс и коэффициент) используется остаточная дисперсия, которая имеет систематическую ошибку в сторону преуменьшения, тем более значительную, чем больше параметров определяется в уравнении регрессии при заданном объеме наблюдений И показатели качества регрессии - student2.ru . Если число параметров при И показатели качества регрессии - student2.ru равно И показатели качества регрессии - student2.ru и приближается к объему наблюдений, то остаточная дисперсия будет близка к нулю и коэффициент (индекс) корреляции приблизится к единице даже при слабой связи факторов с результатом. Для того чтобы не допустить возможного преувеличения тесноты связи, используется скорректированный индекс (коэффициент) множественной корреляции.

Скорректированный индекс множественной корреляции содержит поправку на число степеней свободы, а именно остаточная сумма квадратов И показатели качества регрессии - student2.ru делится на число степеней свободы остаточной вариации И показатели качества регрессии - student2.ru , а общая сумма квадратов отклонений И показатели качества регрессии - student2.ru на число степеней свободы в целом по совокупности И показатели качества регрессии - student2.ru .

Формула скорректированного индекса множественной детерминации имеет вид:

И показатели качества регрессии - student2.ru , (2.17)

где И показатели качества регрессии - student2.ru – число параметров при переменных И показатели качества регрессии - student2.ru ; И показатели качества регрессии - student2.ru – число наблюдений.

Поскольку И показатели качества регрессии - student2.ru , то величину скорректированного индекса детерминации можно представить в виде:

И показатели качества регрессии - student2.ru . (2.17а)

Чем больше величина И показатели качества регрессии - student2.ru , тем сильнее различия И показатели качества регрессии - student2.ru и И показатели качества регрессии - student2.ru .

Как было показано выше, ранжирование факторов, участвующих во множественной линейной регрессии, может быть проведено через стандартизованные коэффициенты регрессии ( И показатели качества регрессии - student2.ru -коэффициенты). Эта же цель может быть достигнута с помощью частных коэффициентов корреляции (для линейных связей). Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов: целесообразность включения того или иного фактора в модель можно доказать величиной показателя частной корреляции.

Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.

Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет дополнительного включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.

В общем виде при наличии И показатели качества регрессии - student2.ru факторов для уравнения

И показатели качества регрессии - student2.ru

коэффициент частной корреляции, измеряющий влияние на И показатели качества регрессии - student2.ru фактора И показатели качества регрессии - student2.ru , при неизменном уровне других факторов, можно определить по формуле:

И показатели качества регрессии - student2.ru , (2.18)

где И показатели качества регрессии - student2.ru – множественный коэффициент детерминации всех И показатели качества регрессии - student2.ru факторов с результатом; И показатели качества регрессии - student2.ru – тот же показатель детерминации, но без введения в модель фактора И показатели качества регрессии - student2.ru .

При двух факторах формула (2.18) примет вид:

И показатели качества регрессии - student2.ru ; И показатели качества регрессии - student2.ru . (2.18а)

Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. Например, И показатели качества регрессии - student2.ru – коэффициент частной корреляции первого порядка. Соответственно коэффициенты парной корреляции называются коэффициентами нулевого порядка. Коэффициенты частной корреляции более высоких порядков можно определить через коэффициенты частной корреляции более низких порядков по рекуррентной формуле:

И показатели качества регрессии - student2.ru .(2.19)

При двух факторах данная формула примет вид:

И показатели качества регрессии - student2.ru ; И показатели качества регрессии - student2.ru . (2.19а)

Для уравнения регрессии с тремя факторами частные коэффициенты корреляции второго порядка определяются на основе частных коэффициентов корреляции первого порядка. Так, по уравнению И показатели качества регрессии - student2.ru возможно исчисление трех частных коэффициентов корреляции второго порядка:

И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru ,

каждый из которых определяется по рекуррентной формуле. Например, при И показатели качества регрессии - student2.ru имеем формулу для расчета И показатели качества регрессии - student2.ru :

И показатели качества регрессии - student2.ru . (2.20)

Рассчитанные по рекуррентной формуле частные коэффициенты корреляции изменяются в пределах от –1 до +1, а по формулам через множественные коэффициенты детерминации – от 0 до 1. Сравнение их друг с другом позволяет ранжировать факторы по тесноте их связи с результатом. Частные коэффициенты корреляции дают меру тесноты связи каждого фактора с результатом в чистом виде. Если из стандартизованного уравнения регрессии И показатели качества регрессии - student2.ru следует, что И показатели качества регрессии - student2.ru , т.е. no силе влияния на результат порядок факторов таков: И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru , то этот же порядок факторов определяется и по соотношению частных коэффициентов корреляции, И показатели качества регрессии - student2.ru .

В эконометрике частные коэффициенты корреляции обычно не имеют самостоятельного значения. Их используют на стадии формирования модели. Так, строя многофакторную модель, на первом шаге определяется уравнение регрессии с полным набором факторов и рассчитывается матрица частных коэффициентов корреляции. На втором шаге отбирается фактор с наименьшей и несущественной по И показатели качества регрессии - student2.ru -критерию Стьюдента величиной показателя частной корреляции. Исключив его из модели, строится новое уравнение регрессии. Процедура продолжается до тех пор, пока не окажется, что все частные коэффициенты корреляции существенно отличаются от нуля. Если исключен несущественный фактор, то множественные коэффициенты детерминации на двух смежных шагах построения регрессионной модели почти не отличаются друг от друга, И показатели качества регрессии - student2.ru , где И показатели качества регрессии - student2.ru – число факторов.

Из приведенных выше формул частных коэффициентов корреляции видна связь этих показателей с совокупным коэффициентом корреляции. Зная частные коэффициенты корреляции (последовательно первого, второго и более высокого порядка), можно определить совокупный коэффициент корреляции по формуле:

И показатели качества регрессии - student2.ru . (2.21)

В частности, для двухфакторного уравнения формула (2.21) принимает вид:

И показатели качества регрессии - student2.ru . (2.21)

При полной зависимости результативного признака от исследуемых факторов коэффициент совокупного их влияния равен единице. Из единицы вычитается доля остаточной вариации результативного признака И показатели качества регрессии - student2.ru , обусловленная последовательно включенными в анализ факторами. В результате подкоренное выражение характеризует совокупное действие всех исследуемых факторов.

Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью И показатели качества регрессии - student2.ru -критерия Фишера:

И показатели качества регрессии - student2.ru , (2.22)

где И показатели качества регрессии - student2.ru – факторная сумма квадратов на одну степень свободы; И показатели качества регрессии - student2.ru – остаточная сумма квадратов на одну степень свободы; И показатели качества регрессии - student2.ru – коэффициент (индекс) множественной детерминации; И показатели качества регрессии - student2.ru – число параметров при переменных И показатели качества регрессии - student2.ru (в линейной регрессии совпадает с числом включенных в модель факторов); И показатели качества регрессии - student2.ru – число наблюдений.

Оценивается значимость не только уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частный И показатели качества регрессии - student2.ru -критерий, т.е. И показатели качества регрессии - student2.ru .

Частный И показатели качества регрессии - student2.ru -критерий построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на одну степень свободы по регрессионной модели в целом. В общем виде для фактора И показатели качества регрессии - student2.ru частный И показатели качества регрессии - student2.ru -критерий определится как

И показатели качества регрессии - student2.ru , (2.23)

где И показатели качества регрессии - student2.ru – коэффициент множественной детерминации для модели с полным набором факторов, И показатели качества регрессии - student2.ru – тот же показатель, но без включения в модель фактора И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru – число наблюдений, И показатели качества регрессии - student2.ru – число параметров в модели (без свободного члена).

Фактическое значение частного И показатели качества регрессии - student2.ru -критерия сравнивается с табличным при уровне значимости И показатели качества регрессии - student2.ru и числе степеней свободы: 1 и И показатели качества регрессии - student2.ru . Если фактическое значение И показатели качества регрессии - student2.ru превышает И показатели качества регрессии - student2.ru , то дополнительное включение фактора И показатели качества регрессии - student2.ru в модель статистически оправданно и коэффициент чистой регрессии И показатели качества регрессии - student2.ru при факторе И показатели качества регрессии - student2.ru статистически значим. Если же фактическое значение И показатели качества регрессии - student2.ru меньше табличного, то дополнительное включение в модель фактора И показатели качества регрессии - student2.ru не увеличивает существенно долю объясненной вариации признака И показатели качества регрессии - student2.ru , следовательно, нецелесообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим.

Для двухфакторного уравнения частные И показатели качества регрессии - student2.ru -критерии имеют вид:

И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru . (2.23а)

С помощью частного И показатели качества регрессии - student2.ru -критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор И показатели качества регрессии - student2.ru вводился в уравнение множественной регрессии последним.

Частный И показатели качества регрессии - student2.ru -критерий оценивает значимость коэффициентов чистой регрессии. Зная величину И показатели качества регрессии - student2.ru , можно определить и И показатели качества регрессии - student2.ru -критерий для коэффициента регрессии при И показатели качества регрессии - student2.ru -м факторе, И показатели качества регрессии - student2.ru , а именно:

И показатели качества регрессии - student2.ru . (2.24)

Оценка значимости коэффициентов чистой регрессии по И показатели качества регрессии - student2.ru -критерию Стьюдента может быть проведена и без расчета частных И показатели качества регрессии - student2.ru -критериев. В этом случае, как и в парной регрессии, для каждого фактора используется формула:

И показатели качества регрессии - student2.ru , (2.25)

где И показатели качества регрессии - student2.ru – коэффициент чистой регрессии при факторе И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru – средняя квадратическая (стандартная) ошибка коэффициента регрессии И показатели качества регрессии - student2.ru .

Для уравнения множественной регрессии И показатели качества регрессии - student2.ru средняя квадратическая ошибка коэффициента регрессии может быть определена по следующей формуле:

И показатели качества регрессии - student2.ru , (2.26)

где И показатели качества регрессии - student2.ru – среднее квадратическое отклонение для признака И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru – среднее квадратическое отклонение для признака И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru – коэффициент детерминации для уравнения множественной регрессии, И показатели качества регрессии - student2.ru – коэффициент детерминации для зависимости фактора И показатели качества регрессии - student2.ru со всеми другими факторами уравнения множественной регрессии; И показатели качества регрессии - student2.ru – число степеней свободы для остаточной суммы квадратов отклонений.

Как видим, чтобы воспользоваться данной формулой, необходимы матрица межфакторной корреляции и расчет по ней соответствующих коэффициентов детерминации И показатели качества регрессии - student2.ru . Так, для уравнения И показатели качества регрессии - student2.ru оценка значимости коэффициентов регрессии И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru предполагает расчет трех межфакторных коэффициентов детерминации: И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru .

Взаимосвязь показателей частного коэффициента корреляции, частного И показатели качества регрессии - student2.ru -критерия и И показатели качества регрессии - student2.ru -критерия Стьюдента для коэффициентов чистой регрессии может использоваться в процедуре отбора факторов. Отсев факторов при построении уравнения регрессии методом исключения практически можно осуществлять не только по частным коэффициентам корреляции, исключая на каждом шаге фактор с наименьшим незначимым значением частного коэффициента корреляции, но и по величинам И показатели качества регрессии - student2.ru и И показатели качества регрессии - student2.ru . Частный И показатели качества регрессии - student2.ru -критерий широко используется и при построении модели методом включения переменных и шаговым регрессионным методом.

Пример.Оценим качество уравнения, полученного в предыдущем параграфе. Сначала найдем значения парных коэффициентов корреляции:

И показатели качества регрессии - student2.ru ;

И показатели качества регрессии - student2.ru ;

И показатели качества регрессии - student2.ru .

Значения парных коэффициентов корреляции указывают на достаточно тесную связь сменной добычи угля на одного рабочего И показатели качества регрессии - student2.ru с мощностью пласта И показатели качества регрессии - student2.ru и на умеренную связь с уровнем механизации работ И показатели качества регрессии - student2.ru . В то же время межфакторная связь И показатели качества регрессии - student2.ru не очень сильная ( И показатели качества регрессии - student2.ru ), что говорит о том, что оба фактора являются информативными, т.е. и И показатели качества регрессии - student2.ru , и И показатели качества регрессии - student2.ru необходимо включить в модель.

Теперь рассчитаем совокупный коэффициент корреляции И показатели качества регрессии - student2.ru . Для этого сначала найдем определитель матрицы парных коэффициентов корреляции:

И показатели качества регрессии - student2.ru ,

и определитель матрицы межфакторной корреляции:

И показатели качества регрессии - student2.ru .

Тогда коэффициент множественной корреляции по формуле (2.16):

И показатели качества регрессии - student2.ru .

Т.е. можно сказать, что 81,7% (коэффициент детерминации И показатели качества регрессии - student2.ru ) вариации результата объясняется вариацией представленных в уравнении признаков, что указывает на весьма тесную связь признаков с результатом.

Примерно тот же результат (различия связаны с ошибками округлений) для коэффициента множественной регрессии получим, если воспользуемся формулами (2.12) и (2.15):

И показатели качества регрессии - student2.ru ;

И показатели качества регрессии - student2.ru .

Скорректированный коэффициент множественной детерминации

И показатели качества регрессии - student2.ru

указывает на умеренную связь между результатом и признаками. Это связано с малым количеством наблюдений.

Теперь найдем частные коэффициенты корреляции по формулам (2.18а) и (2.19а):

И показатели качества регрессии - student2.ru ;

И показатели качества регрессии - student2.ru .

И показатели качества регрессии - student2.ru ;

И показатели качества регрессии - student2.ru .

Т.е. можно сделать вывод, что фактор И показатели качества регрессии - student2.ru оказывает более сильное влияние на результат, чем признак И показатели качества регрессии - student2.ru .

Оценим надежность уравнения регрессии в целом и показателя связи с помощью И показатели качества регрессии - student2.ru -критерия Фишера. Фактическое значение И показатели качества регрессии - student2.ru -критерия (2.22)

И показатели качества регрессии - student2.ru .

Табличное значение И показатели качества регрессии - student2.ru -критерия при пятипроцентном уровне значимости ( И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru ): И показатели качества регрессии - student2.ru . Так как И показатели качества регрессии - student2.ru , то уравнение признается статистически значимым.

Оценим целесообразность включения фактора И показатели качества регрессии - student2.ru после фактора И показатели качества регрессии - student2.ru и И показатели качества регрессии - student2.ru после И показатели качества регрессии - student2.ru с помощью частного И показатели качества регрессии - student2.ru -критерия Фишера (2.23а):

И показатели качества регрессии - student2.ru ;

И показатели качества регрессии - student2.ru .

Табличное значение частного И показатели качества регрессии - student2.ru -критерия при пятипроцентном уровне значимости ( И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru , И показатели качества регрессии - student2.ru ): И показатели качества регрессии - student2.ru . Так как И показатели качества регрессии - student2.ru , а И показатели качества регрессии - student2.ru , то включение фактора И показатели качества регрессии - student2.ru в модель статистически оправдано и коэффициент чистой регрессии И показатели качества регрессии - student2.ru статистически значим, а дополнительное включение фактора И показатели качества регрессии - student2.ru , после того, как уже введен фактор И показатели качества регрессии - student2.ru , нецелесообразно.

Уравнение регрессии, включающее только один значимый аргумент И показатели качества регрессии - student2.ru :

И показатели качества регрессии - student2.ru .

Наши рекомендации