Частные уравнения регрессии
На основе линейного уравнения множественной регрессии
могут быть найдены частные уравнения регрессии:
т.е. уравнения регрессии, которые связывают результативный признак с соответствующими факторами при закреплении других учитываемых во множественной регрессии факторов на среднем уровне. Частные уравнения регрессии имеют следующий вид:
При подстановке в эти уравнения средних значений соответствующих факторов они принимают вид парных уравнений линейной регрессии, т. е. имеем:
, где
В отличие от парной регрессии частные уравнения регрессии характеризуют изолированное влияние фактора на результат, ибо другие факторы закреплены на неизменном уровне. Эффекты влияния других факторов присоединены в них к свободному члену уравнения множественной регрессии. Это позволяет на основе частных уравнений регрессии определять частные коэффициенты эластичности:
где – коэффициенты регрессии для фактора х, в уравнении множественной регрессии;
– частное уравнение регрессии.
Пример. Предположим, что по ряду регионов множественная регрессия величины импорта на определенный товар относительно отечественного его производства , изменения запасов и потребления на внутреннем рынке оказалась следующей:
.
При этом средние значения для рассматриваемых признаков составили:
, , , .
На основе данной информации могут быть найдены средние по совокупности показатели эластичности:
Для данного примера они окажутся равными:
,
т.е. с ростом величины отечественного производства на 1 % размер импорта в среднем по совокупности регионов возрастет на 1,053 % при неизменных запасах и потреблении семей.
Для второй переменной коэффициент эластичности составляет:
,
т.е. с ростом изменения запасов на 1 % при неизменном производстве и внутреннем потреблении величина импорта увеличивается в среднем на 0,056 %.
Для третьей переменной коэффициент эластичности составляет:
,
т.е. при неизменном объеме производства и величины запасов с увеличением внутреннего потребления на 1 % импорт товара возрастает в среднем по совокупности регионов на 1,987 %. Средние показатели эластичности можно сравнивать друг с другом и соответственно ранжировать факторы по силе их воздействия на результат. В рассматриваемом примере наибольшее воздействие на величину импорта оказывает размер внутреннего потребления товара , а наименьшее – изменение запасов .
Наряду со средними показателями эластичности в целом по совокупности регионов на основе частных уравнений регрессии могут быть определены частные коэффициенты эластичности для каждого региона. Частные уравнения регрессии в нашем случае составят:
Подставляя в данные уравнения фактические значения по отдельным регионам соответствующих факторов, получим значения моделируемого показателя при заданном уровне одного фактора и средних значениях других факторов. Эти расчетные значения результативного признака используются для определения частных коэффициентов эластичности по приведенной выше формуле. Так, если, например, в регионе ; ; , то частные коэффициенты эластичности составят:
,
,
.
Как видим, частные коэффициенты эластичности для региона несколько отличаются от аналогичных средних показателей по совокупности регионов. Они могут быть использованы при принятии решений относительно развития конкретных регионов.
МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ
Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации.
Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного влияния факторов на результат.
Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:
где – общая дисперсия результативного признака;
– остаточная дисперсия для уравнения .
Методика построения индекса множественной корреляции аналогична построению индекса корреляции для парной зависимости. Границы его изменения те же: от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов. Величина индекса множественной корреляции должна быть больше или равна максимальному парному индексу корреляции:
.
При правильном включении факторов в регрессионный анализ величина индекса множественной корреляции будет существенно отличаться от индекса корреляции парной зависимости. Если же дополнительно включенные в уравнение множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции (различия в третьем, четвертом знаках). Отсюда ясно, что, сравнивая индексы множественной и парной корреляции, можно сделать вывод о целесообразности включения в уравнение регрессии того или иного фактора. Так, если рассматривается как функция и и получен индекс множественной корреляции , а индексы парной корреляции при этом были и , то совершенно ясно, что уравнение парной регрессии охватывало 67,2 % колеблемости результативного признака под влиянием фактора , а дополнительное включение в анализ фактора увеличило долю объясненной вариации до 72,3,%, т. е. уменьшилась доля остаточной вариации на 5,1 проц. пункта (с 32,8 до 27,7%).
Расчет индекса множественной корреляции предполагает определение уравнения множественной регрессии и на его основе остаточной дисперсии:
.
Можно пользоваться следующей формулой индекса множественной корреляции:
При линейной зависимости признаков формула индекса корреляции может быть представлена следующим выражением:
,
где – стандартизованные коэффициенты регрессии;
– парные коэффициенты корреляции результата с каждым фактором.
Или, по-другому:
Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции, или, что то же самое, совокупного коэффициента корреляции.
Возможно также при линейной зависимости определение совокупного коэффициента корреляции через матрицу парных коэффициентов корреляции:
где – определитель матрицы парных коэффициентов корреляции;
– определитель матрицы межфакторной корреляции.
Для уравнения определитель матрицы коэффициентов парной корреляции примет вид:
Определитель более низкого порядка остается, когда вычеркиваются из матрицы коэффициентов парной корреляции первый столбец и первая строка, что и соответствует матрице коэффициентов парной корреляции между факторами:
Как видим, величина множественного коэффициента корреляции зависит не только от корреляции результата с каждым из факторов, но и от межфакторной корреляции. Рассмотренная формула позволяет определять совокупный коэффициент корреляции, не обращаясь при этом к уравнению множественной регрессии, а используя лишь парные коэффициенты корреляции.
При трех переменных для двухфакторного уравнения регрессии данная формула совокупного коэффициента корреляции легко приводится к следующему виду:
Индекс множественной корреляции равен совокупному коэффициенту корреляции не только при линейной зависимости рассматриваемых признаков. Тождественность этих показателей, как и в парной регрессии, имеет место и для криволинейной зависимости, нелинейной по переменным.
В рассмотренных показателях множественной корреляции (индекс и коэффициент) используется остаточная дисперсия, которая имеет систематическую ошибку в сторону преуменьшения. Эта ошибка тем более значительна, чем больше параметров определяется в уравнении регрессии при заданном объеме наблюдений . Если число параметров при равно и приближается к объему наблюдений, то остаточная дисперсия будет близка к нулю, и коэффициент (индекс) корреляции приблизится к единице даже при слабой связи факторов с результатом. Для того чтобы не допустить возможного преувеличения тесноты связи, используется скорректированный индекс (коэффициент) множественной корреляции.
Скорректированный индекс множественной корреляции содержит поправку на число степеней свободы, а именно остаточная сумма квадратов делится на число степеней свободы остаточной вариации , а общая сумма квадратов отклонений – на число степеней свободы в целом по совокупности .
Формула скорректированного индекса множественной детерминации имеет вид:
где – число параметров при переменных ;
– число наблюдений.
Поскольку , то величину скорректированного индекса детерминации можно представить в виде
Чем больше величина , тем сильнее различия и .
Для линейной зависимости признаков скорректированный коэффициент множественной корреляции определяется по той же формуле, что и индекс множественной корреляции, т.е. как корень квадратный из . Отличие состоит лишь в том, что в линейной зависимости под подразумевается число факторов, включенных в регрессионную модель, а в криволинейной зависимости – число параметров при и их преобразованиях ( , и др.), которое может быть больше числа факторов как экономических переменных.
Пример. Предположим, что при для линейного уравнения регрессии с четырьмя факторами , а с учетом корректировки на число степеней свободы
Чем больше объем совокупности, по которой исчислена регрессия, тем меньше различаются показатели и . Так, уже при при том же значении и т величина составит 0,673.
В статистических пакетах прикладных программ в процедуре множественной регрессии обычно приводится скорректированный коэффициент (индекс) множественной корреляции (детерминации). Величина коэффициента множественной детерминации используется для оценки качества регрессионной модели. Низкое значение коэффициента (индекса) множественной корреляции означает, что в регрессионную модель не включены существенные факторы – с одной стороны, а с другой стороны – рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. Требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости.
ЧАСТНАЯ КОРРЕЛЯЦИЯ
Как было показано выше, ранжирование факторов, участвующих в множественной линейной регрессии, может быть проведено через стандартизованные коэффициенты регрессии ( -коэффициенты). Эта же цель может быть достигнута с помощью частных коэффициентов корреляции – для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов: целесообразность включения того или иного фактора в модель доказывается величиной показателя частной корреляции.
Частные коэффициенты (или индексы) корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии.
Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет дополнительного включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.
Например, если была зависимость от одного фактора , то сокращение остаточной дисперсии за счет дополнительного включения фактора составит .
Чем больше доля этого сокращения в остаточной вариации до введения дополнительного фактора, т.е. в , тем теснее связь между и при постоянном действии фактора . Корень квадратный из этой величины и есть индекс частной корреляции, показывающий в «чистом» виде тесноту связи с .
Следовательно, чистое влияние фактора на результат у можно определить как
Аналогично определяется и чистое влияние на результат фактора :
Если рассматривается регрессия с числом факторов , то возможны частные коэффициенты корреляции не только первого, но и второго, третьего, ..., порядка, т. е. влияние фактора , можно оценить при разных условиях независимости действия других факторов:
– при постоянном действии фактора ;
– при постоянном действии факторов и ;
– при неизменном действии всех факторов, включенных в уравнение регрессии.
Сопоставление коэффициентов частной корреляции разного порядка по мере увеличения числа включаемых факторов показывает процесс «очищения» зависимости результативного признака с исследуемым фактором.
Хотя частная корреляция разных порядков и может представлять аналитический интерес, в практических исследованиях предпочтение отдают показателям частной корреляции самого высокого порядка, ибо именно эти показатели являются дополнением к уравнению множественной регрессии.
В общем виде при наличии факторов для уравнения
коэффициент частной корреляции, измеряющий влияние на фактора при неизменном уровне других факторов, можно определить по формуле
где – множественный коэффициент детерминации всего комплекса факторов с результатом;
– тот же показатель детерминации, но без введения в модель фактора .
При формула коэффициента частной корреляции примет вид:
Данный коэффициент частной корреляции позволяет измерить тесноту связи между и при неизменном уровне всех других факторов, включенных в уравнение регрессии.
Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. Например, – коэффициент частной корреляции первого порядка. Соответственно коэффициенты парной корреляции называются коэффициентами нулевого порядка. Коэффициенты частной корреляции более высоких порядков можно определить через коэффициенты частной корреляции более низких порядков по рекуррентной формуле.
При двух факторах и данная формула примет вид:
Соответственно при и двух факторах частный коэффициент корреляции с фактором можно определить по формуле
Рассчитанные по рекуррентной формуле частные коэффициенты корреляции изменяются в пределах от –1 до +1, а по формулам через множественные коэффициенты детерминации – от 0 до 1. Сравнение их друг с другом позволяет ранжировать факторы по тесноте их связи с результатом. Частные коэффициенты корреляции, подтверждая ранжировку факторов по их воздействию на результат, на основе стандартизованных коэффициентов регрессии ( -коэффициентов) в отличие от последних дают конкретную меру тесноты связи каждого фактора с результатом в чистом виде.
Согласованность частной корреляции и стандартизованных коэффициентов регрессии наиболее отчетливо видна из сопоставления их формул при двухфакторном анализе.
Сравнивая их с рекуррентными формулами расчета частных коэффициентов корреляции и , можно видеть, что
В эконометрике частные коэффициенты корреляции обычно не имеют самостоятельного значения. В основном их используют на стадии формирования модели, в частности в процедуре отсева факторов. Так, строя многофакторную модель, например, методом исключения переменных, на первом шаге определяется уравнение регрессии с полным набором факторов и рассчитывается матрица частных коэффициентов корреляции. На втором шаге отбирается фактор с наименьшей и несущественной по -критерию Стьюдента величиной показателя частной корреляции. Исключив его из модели, строится новое уравнение регрессии. Процедура продолжается до тех пор, пока не окажется, что все частные коэффициенты корреляции существенно отличаются от нуля. Если исключен несущественный фактор, то множественные коэффициенты детерминации на двух смежных шагах построения регрессионной модели почти не отличаются друг от друга, т. е. где – число факторов.