В эконометрических исследованиях
ИСТОРИЯ СТАНОВЛЕНИЯ И РАЗВИТИЯ ЭКОНОМЕТРИКИ
ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ
В ЭКОНОМЕТРИЧЕСКИХ ИССЛЕДОВАНИЯХ
Наиболее широкое распространение в эконометрических исследованиях получили линейные регрессионные модели вида (2.1)
, (2.1)
где y – результативная (зависимая) переменная (фактор-результат);
x – независимая переменная (фактор-признак);
a,b – параметры модели.
Основными этапами эконометрического исследования являются следующие:
выбор формы уравнения взаимосвязи исследуемых факторов;
определение параметров уравнения регрессии;
оценка тесноты взаимосвязи (корреляции) исследуемых факторов;
оценка адекватности (статистической значимости) уравнения регрессии;
оценка статистической значимости параметров уравнения регрессии.
Кроме указанных этапов, прикладные исследования могут включать этапы, связанные с проведением аналитического прогноза единичных значений результативной переменной, а также оценкой точности и достоверности прогноза.
Параметры регрессионной модели, как правило, оцениваются методом наименьших квадратов (МНК), суть которого заключается в том, что сумма квадратов отклонения фактических значений результативного признака (yi) от соответствующих теоретических значений ( ), полученных на основе выбранной модели, должна быть минимальной:
. (2.2)
В данном случае на основе МНК образуется система нормальных уравнений, решая которую получают значения параметров отобранных регрессионных моделей. Так, для линейной регрессии ( ) система нормальных уравнений имеет вид (2.3):
(2.3)
После очевидных и несложных преобразований окончательные выражения для определения параметров линейной регрессии имеют вид:
(2.4)
(2.5)
где - среднее значение произведения факторов x и y;
- среднее значение фактора x;
- среднее значение фактора y;
- среднее значение фактора x2;
- квадрат среднего значения фактора x;
- среднее квадратическое отклонение фактора x;
- среднее квадратическое отклонение фактора y.
Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора-признака на одну единицу. Кроме того, в ряде случаев для удобства интерпретации параметра b используют коэффициент эластичности. Он показывает средние изменения результативного признака (в %) при изменении факторного признака на 1% и вычисляется по следующей формуле:
. (2.7)
Параметр a может не иметь экономического смысла. Формально параметр a – значение фактора y при x=0. Если фактор-признак x не имеет и не может иметь нулевого значения, то вышеуказанная трактовка параметра a не имеет смысла. Попытки экономически интерпретировать параметр a могут привести к абсурду, особенно при a < 0. Интерпретировать можно лишь знак при параметре a. Если a > 0, то относительное изменение результата происходит медленнее, чем изменение фактора x.
Выражения для нахождения линейного коэффициента корреляции:
(2.8)
(2.9)
(2.10)
где n - размерность исследуемой выборки (количество наблюдений).
Величина коэффициента корреляции находится в пределах: и может принимать следующие значения:
если значение , то корреляция между исследуемыми факторами отсутствует (факторы некоррелированы);
если значение находится в пределах (0…0,3], то между исследуемыми факторами имеется слабая связь;
если значение находится в пределах (0,3…0,5], то между исследуемыми факторами имеется умеренная связь;
если значение находится в пределах (0,5…0,7], то между исследуемыми факторами имеется довольно устойчивая статистическая связь;
если значение > 0,7 , то между исследуемыми факторами имеется сильная связь (статистически значимая связь, факторы сильно коррелированны);
если значение = 1, то между исследуемыми факторами имеется функциональная зависимость.
Оценка адекватности формы регрессионной модели может быть проведена с помощью:
среднего коэффициента аппроксимации (Ā);
критерия Фишера;
коэффициента детерминации (R2).
Оценку адекватности регрессионной модели на основе среднего коэффициента аппроксимации используют следующее выражение (среднюю относительную погрешность):
, (2.11)
Уравнение регрессии считается адекватным (точным, статистически значимым), если значение среднего коэффициента аппроксимации не превышает 8…10%.
Наиболее полно и точно проверка адекватности регрессионных моделей проводится с помощью критерия Фишера:
если Fрасч. > Fкр, то принимается основная гипотеза (Ho), свидетельствующая о правильности выбранной формы взаимосвязи исследуемых факторов;
если Fрасч. < Fкр, то принимается альтернативная гипотеза (H1), свидетельствующая о статистической незначимости выбранной формы взаимосвязи исследуемых факторов.
Эмпирическое (расчетное) значение критерия (Fрасч.) определяется с помощью следующего выражения:
(2.12)
где Dфакт – дисперсия факторная (3.18);
, (2.13)
Dост – дисперсия остаточная, определяема по выражению (2.14);
m – число параметров уравнения регрессии;
. (2.14)
Табличное (критическое) значение критерия (Fкр.) определяется с помощью справочников или таблицам Excel (раздел мастера функций «Статистические»): Fкр=FРАСПОБР(α=1-P; ν1; ν2),
где ν1 и ν2 - степенисвободы (ν1=m-1; ν2=n-m).
Сущность чисел степеней свободы (df – degrees of freedom) заключается в определении чисел свободы независимого варьирования признака, т.е указывают сколько независимых отклонений из n возможных требуется для образования данной суммы квадратов.
Процедура вычисление расчетного значения критерия Фишера тесно связана с процедурой вычисления коэффициента детерминации (R2)
, (2.15)
Значение коэффициента детерминации имеет следующие значения R2 [0; 1].
Сущность коэффициента детерминации заключается в том, что он показывает зависимость вариации значений результативного признака (в %) от вариации значений фактора-признака (независимой переменной).
Иногда (при больших значениях объема выборки (n)) используют упрощенную формулу для вычисления коэффициента детерминации R2:
. (2.16)
Приведенные выше выражения для вычисления коэффициента детерминации также используют при оценке тесноты взаимосвязи факторов нелинейной регрессии. Применительно к данной области эконометрических исследований для оценки тесноты взаимосвязи факторов нелинейной регрессии используется понятие корреляционного отношения (η):
(2.17)
где Dост - остаточная дисперсия, определяемая из уравнения регрессии ;
Dобщ - общая дисперсия результативного признака y;
. (2.18)
Величина показателя η находится в пределах: .