Линейная модель наблюдений имеет вид
Методические указания к выполнению семестрового задания по дисциплине
«ЭКОНОМЕТРИКА»
Для студентов-магистров заочной формы обучения
Введение
В соответствии с учебным планом и рабочей программой по курсу «Эконометрика» каждый студент заочной формы обучения должен выполнить в 1 семестре 1 курса семестровую работу. Изучение этой дисциплины предполагает приобретение студентами опыта построения эконометрических моделей, принятия решения о спецификации и идентификации модели, оценки параметров модели, интерпретации результатов, получения прогнозных оценок.
Семестровая работа содержит 5 заданий, объединённых в рамках единой комплексной задачи. Перед выполнением заданий рекомендуется ознакомиться с соответствующими темами эконометрики:
– линейная модель наблюдений;
– оценка существенности параметров линейной регрессии и корреляции;
– нелинейная связь между переменными;
– интервалы прогноза по линейному уравнению регрессии;
– нелинейная регрессия;
– корреляция для нелинейной регрессии;
– средняя ошибка аппроксимации.
В данных методических указаниях в краткой форме приведены основные понятия перечисленных тем, предложен пример выполнения семестровой работы
В конце методических указаний содержатся варианты заданий и основные статистико-математические таблицы, необходимые для решения задач.
1. Однофакторный регрессионно – корреляционный анализ экономической модели
Уравнение связи двух переменных у и х
называется уравнением парной регрессии (однофакторной моделью). Переменную при этом называют результативным признаком (эндогенной переменной), а переменную х – факторным признаком (экзогенной переменной).
Пусть имеется n значений переменных у и х: уi и хi (i = 1, 2 ,…, n). Разместив на плоскости в прямоугольной системе координат точки (хi, уi) с абсциссами хi и ординатами уi , получим диаграмму регрессии (поле корреляции). Эти точки будут образовывать облако рассеяния, вытянутое в некотором направлении. По виду поля корреляции формулируют гипотезу о форме связи.
Различают линейные и нелинейные регрессии.
Линейная модель наблюдений имеет вид
, (i = 1, 2,…, n).
Нелинейные регрессии делятся на два класса:
– регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам. Например, полиномы разных степеней:
,
,
равносторонние гиперболы
;
– регрессии нелинейные по оцениваемым параметрам. Например,
степенная функция ,
показательная функция ,
экспоненциальная функция .
Построение уравнения регрессии сопровождается оценкой его параметров. Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК).
Согласно МНК, среди всех возможных значений параметров a и b, претендующих на роль оценок параметров а и b, следует выбрать такую пару a, b, для которой
.
Иначе говоря, выбирается такая пара параметров a, b, для которой сумма квадратов оказывается наименьшей.
Для линейных и приводимых к линейным нелинейных уравнений, заданное условие приводит к системе нормальных уравнений
,
.
решая которую, имеем
, ,
где
– среднее значение последовательности х1, х2,…, хn,
– среднее значение последовательности у1, у2,…, уn,
– выборочная дисперсия,
– выборочная ковариация.
Для любой точки (хi, уi) на диаграмме рассеяния можно записать
,
где – ордината точки линии регрессии (модели), имеющей абсциссу хi.
Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной.
Возведем обе части последнего представления в квадрат и просуммируем левые и правые части полученных для каждого из i равенств соответственно, получим
.
Рассмотрев сумму более подробно, можно показать, что она в силу системы нормальных уравнений равна нулю.
Тогда
(1)
общая сумма квадратов отклонений TSS | сумма квадратов отклонений, объясненная регрессией ESS | остаточная сумма квадратов отклонений RSS |
Выражение (1) представляет собой разложение полной суммы квадратов на сумму квадратов, объясненную моделью, и остаточную сумму квадратов.
Долю дисперсии, объясняемую регрессией в общей дисперсии результативного признака у, характеризует коэффициент (индекс) детерминации
.
Этот коэффициент изменяется в пределах от 0 (при , т.е. RSS = TSS) до 1 (при RSS = 0). Таким образом,
.
Значение тем выше, чем больше доля объясненной моделью суммы квадратов ESS по отношению к полной сумме квадратов TSS.
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии ( )
,
где , – средние квадратические ошибки выборки величин х и у,
и индекс корреляции – для нелинейной регрессии ( )
.
Чем ближе значение коэффициента (или индекса) корреляции к единице, тем теснее корреляционная связь.
Заметим, что коэффициент детерминации есть квадрат коэффициента или индекса корреляции.
Средний коэффициент эластичности для рассматриваемой парной модели регрессии рассчитывается по формуле
и показывает, на сколько процентов в среднем по совокупности изменится результативный признак у от своей средней величины при изменении факторного признака х на один процент.
Бета–коэффициент показывает, на какую часть величины своего среднего квадратического отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднего квадратического отклонения и задается формулой
.
После того, как построено уравнение регрессии, необходимо провести оценку значимости как уравнения в целом, так и отдельных его параметров. Оценка значимости уравнения регрессии часто делается с помощью F – критерия Фишера. При этом выдвигается нулевая гипотеза Н0 о том, что коэффициент регрессии равен нулю (b = 0) и тем самым предполагается, что фактор х не оказывает влияния на результат у.
Существует равенство между числом степеней свободы общей и факторной с остаточной суммами квадратов. Имеем два соответствующих друг другу равенства
,
n – 1 = 1 + (n –2).
Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений, или дисперсию D на одну степень свободы
, , .
Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим F – критерий
.
Разработаны таблицы (см. таблицы в конце пособия) критических значений F – критерия при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Вычисленное значение F – критерия признается достоверным (отличным от единицы), если оно больше табличного (Fфакт>Fтабл,). В этом случае нулевая гипотеза Но об отсутствии связи признаков отвергается.
Если же его величина окажется меньше табличной (Fфакт<Fтабл,), то вероятность нулевой гипотезы Но выше заданного уровня значимости g (например g = 0,05) и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым, Но не отклоняется.
Оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа (табл. 1).
Таблица 1
Источники вариации | Число степеней свободы | Сумма квадратов отклонений | Дисперсия на одну степень свободы | F – отношение | |
факт | таблич. при a=0,05 | ||||
Общая | n–1 | ||||
Объясненная | |||||
Остаточная | n–2 |
В линейной регрессии обычно оценивается не только уравнение в целом, но и отдельные его параметры. С этой целью по каждому из параметров определяется его стандартная ошибка: mb, ma.
Стандартная ошибка коэффициента регрессии определяется по формуле
,
где – остаточная дисперсия на одну степень свободы
.
Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т.е. определяется фактическое значение t – критерия Стьюдента , которое затем сравнивается с табличным значением (см. таблицу в конце пособия) при определенном уровне значимости g и числе степеней свободы (n – 2).
Можно показать справедливость равенства .
Если фактическое значение t – критерия превышает табличное, то гипотезу о существенности коэффициента можно отклонить.
Границы доверительного интервала коэффициента регрессии b определяются как .
Стандартная ошибка параметра a определяется по формуле
.
Процедура оценивания существенности данного параметра не отличается от рассмотренной выше для коэффициента регрессии. Вычисляется t – критерий: , его величина сравнивается с табличным значением при (n –2) степенях свободы и заданном уровне значимости g.
Границы доверительного интервала параметра a определяются как .
Предельная ошибка D каждого показателя имеет вид:
, .
Значимость линейного коэффициента корреляции проверяется по величине ошибки коэффициента корреляции:
.
При этом, – фактическое значение t – критерия Стьюдента.
Данная формула свидетельствует о том, что в парной линейной регрессии , и . Таким образом, проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности уравнения регрессии.
Если значение значительно превышает табличное значение при заданном уровне значимости g, то коэффициент корреляции существенно отличен от нуля, и построенная модель является достоверной.
Рассмотренная оценка коэффициента корреляции рекомендуется к применению при большом числе наблюдений и если r не близок к +1 или –1.
Фактические значения результативного признака у отличаются от теоретических значений , рассчитанных по уравнению регрессии. Чем меньше это отличие, тем ближе теоретические значения подходят к эмпирическим данным, лучше качество модели.
Величина отклонений фактических и расчетных значений результативного признака по каждому наблюдению представляет ошибку аппроксимации. Их число соответствует объему совокупности. Отклонения несравнимы между собой. Так, если для одного наблюдения , а для другого оно равно 10, то это не означает, что во втором случае модель дает вдвое худший результат. Для сравнения используются величины отклонений, выраженные в процентах к фактическим значениям.
Чтобы иметь общее представление о качестве модели, из относительных отклонений по каждому наблюдению определяют среднюю ошибку аппроксимации –среднее отклонение расчетных значений от фактических:
.
Допустимый предел значений – не более 8–10%.
Прогнозное значение ур определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения хр.
Средняя стандартная ошибка прогноза определяется по формуле:
.
Границы доверительного интервала прогноза определяются как , где – ошибка прогноза.