Тема 2. Общая характеристика эконометрического моделирования
Рассмотрим типичную для исследования социально-экономических объектов ситуацию. Имеются разные экономические показатели, потенциально управляемые непосредственно и опосредованно. При этом циклически возобновляются похожие условия управления. И имеется возможность измерять (отслеживать) значения указанных показателей в совокупности. Тогда основная цель применения эконометрической модели – обеспечить на основании накопленных данных прогнозирование значений зависимой переменной(объясняемой, опосредованно управляемой)при определённых значениях других переменных (объясняющих, непосредственно управляемых). Причём, параллельно с оценкой ожидаемой погрешности прогнозов либо из-за отсутствия данных, либо из-за случайности. Так, по конкретным данным может быть восстановлена зависимость, например, в форме y=18000-1000·x1-0,5·x2+ε, где y – цена автомобиля, x1 – срок его эксплуатации (в годах), x2 – пробег (в тыс.км), ε – погрешность(ошибка) [1, с.10]. Тогда допустимо оценивать стоимость автомобиля при известных сроке эксплуатации и пробеге.
Эконометрическое моделирование, предусматривает оперирование понятием «вероятность», предполагая идеализацию – отвлечение от измерительных погрешностей, допуская потенциальную многократную повторяемость статистической проверки. В целом, предполагается стохастическая (случайная) природа исследуемых явлений. Математические модели скрытых (неявно существующих) закономерностей вместе с их теоретическим и эмпирическим анализом основаны на теории вероятностей и математической статистике. Теоретико-вероятностный, статистический подход к выработке рекомендаций по принятию управленческих решений диктуется и обычным здравым смыслом. Такой подход основан на применении пространства возможных событий и, в целом, расширяет знания о природе явлений, в частности о возможностях приложения полученных выводов на основании и теоретико-вероятностных заключений, и на основании накопленной статистики практических проявлений, связанных с теорией. В частности это позволяет «сворачивать» таблицы данных, выявлять эконометрические зависимости параллельно с оценками ожидаемых отклонений при их применении.
Термин «регрессия» в обыденном понимании иногда увязывают с понятиями «отступление», «возврат». В статистике термин «регрессия» интерпретируется иначе – если и отступление, то отступление к «истокам» (скорее – «восхождение к сущности»). Специальный математический смысл термина «регрессия» – это зависимость среднего значения какой-либо величины от нескольких других величин. «Парная регрессия», предполагает зависимость среднего значения какой-либо величины (у) от некоторой другой величины (х). В отличие от функциональной зависимости (у = f(х)), когда каждому значению аргумента (х) ставится в соответствие единственное значение функции (у), при наличии регрессионной связи одному значению «объясняющей» переменной (х) могут соответствовать разные, в зависимости от случая, значения «объясняемой» переменной (у). Если при значении «объясняющей» переменной х=хi наблюдается m значений у i1 , у i2 ,…, у im «объясняемой» переменной у, то зависимость математического ожидания
у i* = (у i1 + у i2 +…+ у im)/m
от хi является регрессией в статистическом понимании этого термина.
Понятие «парная регрессия», рассматриваемое в рамках специальных дисциплин, таких как теория вероятностей, математическая статистика, эконометрика, предусматривает рассмотрение случайных величин Х, У с заданным совместным распределением вероятностей. Получается, что при фиксированном значении Х=х
величина У является случайной величиной с определенным (зависящим от значения х)
условным распределением вероятностей. По существу, регрессия величины У по величине Х определяется условным математическим ожиданием У при условии, что Х=х:
E(Y|Х=х) = у(х)
Уравнение у = у(х), в котором х выступает в роли «независимой» переменной, называют уравнением регрессии. Соответствующий график (на плоскости) принято считать линией (кривой) регрессии величины У по величине Х; х называют регрессором. Эконометрическая модель принимает вид:
Y = E(Y|Х=х) + ε,
ε – возмущение (ошибка). Получаем уравнение регрессионной модели. Заметим, эконометрическая модель не всегда является регрессионной, т.е. объяснённая часть не всегда представляет собой условное математическое ожидание (возможны смещения).
Точность, с которой уравнение регрессии величины Y по величине X отражает изменение Y в среднем при изменении х, измеряется условной дисперсией величины Y, вычисленной для каждого значения Х=х:
D(Y|X=х) = σ2(х).
Если σ2(х)=0 при всех значениях х, то можно с достоверностью (с вероятностью 1) утверждать, что величины Y и X связаны строгой функциональной зависимостью. Если σ2(х)≠0 ни при каких значениях х и у(х) не зависит от х, то говорят, что регрессия величины Y по величине X отсутствует. «Регрессия» обладает следующим важным свойством: среди всех действительных функций у = у(х) минимум мат.ожидания
E(Y- у(х))2
достигается для функции у(х)= E(Y|Х=х), то есть регрессия величины Y по величине X дает наилучшее, в указанном смысле, представление величины Y по величине X. Это свойство используют для прогноза Y по X: если наблюдается лишь компонента X вектора [X, Y], то в качестве прогнозируемого значения Y используют величину у(X).
Регрессионная модель, восстанавливающая зависимость, в общем случае имеет вид y= f(x1,…,xk,β1, …,βp), где x1,…,xk – независимые (объясняющие) переменные, β1,…, βp – параметры. В зависимости от вида функции (f) выделяют линейные и нелинейные модели. Построение указанной модели предусматривает анализ экономической сущности объекта с целью определения объяснимого фактора (y), выбор вида f, подбор объясняющих факторов (переменных x1,…,xk). Кроме того, потребуется применить специальные вероятностно-статистические (математические) методы для выявления параметров модели β1,…, βp. При этом предполагается наличие «статистического ансамбля» (имеется практическая или мысленно представимая возможность многократного тождественного воспроизведения событий) и данных, характеризующих проявления искомой зависимости.
Наличие регрессии может проявляться в том, что для одного Х уместно наблюдать разные значения величины Y. При этом природа ошибки может быть разной. Во-первых, модель в виде определенной зависимости всегда предполагает упрощение реальности (возможно, отброшены влияющие на результат факторы, а значит и соответствующие переменные). Во вторых, могут присутствовать ошибки измерений. Тогда случайной величине εi может соответствовать случайная величина Y i согласно линейной модели
Y i=a+b·X i+εi, i=1,…,n
(независимо от того, что X i детерминированная величина, то есть неслучайная). Типовые ситуации приложений модели парной линейной регрессии для пространственных данных («cross-sectional data») определяют следующие гипотезы:
1. Y i=a+b·X i+εi, i=1,…,n.
2. X i детерминированная величина; вектор [X1,…,X n], неколлинеарен вектору [1,…,1].
3а. E(εi) = 0, E(εi2) = V(εi) = σ2 – не зависит от i (i=1,…,n).
3b. E(εjεi) = 0 при j≠i (некореллированность ошибок при разных наблюдениях).
Часто добавляют условие…
3c. εi~ N(0, σ2),то есть εi– нормально распределенная случайная величина со средним 0 и дисперсией σ2.
Иногда на практике могут присутствовать и нестандартные условия, проявляющиеся в специфике соответствующих гипотез. Так, условие независимости дисперсии от номера наблюдений (E(εi) = 0, E(εi2) = V(εi) = σ, i=1,…,n) называют гомоскедастичностью (дополняющее условие, то есть невыполнение гомоскедастичности, называют гетероскедастичностью, например, может быть E(εi) = X i2 с асинхронным разбросом ошибки в зависимости от i). Условие E(εjεi) = 0, в частности, не характерно временным рядам. При E(εjεi) ≠ 0 говорят о наличии автокорреляции остатков.
В моделях временных рядов (применяемых для «time-series data» – упорядоченных по времени данных) в аддитивной форме один фактор y= f1(x1,…,xk,t,β11, …,β1p)+ f2(x1,…,xk, t,β21, …,β2q)+εt увязывают с независимыми (объясняющими) переменными дважды, выделяя так называемый «тренд» (f1) и «сезонность»( f2). Здесь εt – случайная (стохастическая) компонента, зависящая от времени t. Мультипликативная форма во многом аналогична y= f1(x1,…,xk,t,β11, …,β1p)× f2(x1,…,xk,t,β21, …,β2q) +εt. Причем сезонность, в свою очередь, может включать несколько составляющих (например, недельную, проявляющуюся ежемесячно, годовую тенденции).
Обобщением понятия регрессионная модель выступает модель в форме системы одновременных уравнений. Принципиальное отличие в том, что рассматриваются несколько (конечное множество) регрессионных моделей в совокупности. Естественно их одновременное использование обеспечивает поиск решений принципиально по иному, нежели, например, при последовательном применении каждой из моделей отдельно.
Прикладное математическое моделирование – это циклически возобновляемый процесс. Основные этапы вероятностно-статистического моделирования таковы:
1) постановочный, включает определение набора факторов, подразделение их на объясняющие (входные переменные) и объяснимые (выходные показатели);
2) априорный, выбор связей между факторами;
3) информационно-статистический, сбор информации по объясняющим факторам;
4) спецификация модели, выявление структурных характеристик модели;
5) идентификация модели, подбор значений параметров модели;
6) верификация модели, проверка адекватности прогнозов по модельным решениям результатам применения модельных решений на практике;
Наличие 3) и 5) этапов определяет вероятностно-статистическую сущность модели.
Вопросы по 2-ой теме:
2.1. В чём основная цель применения эконометрической модели о связи между показателями?
2.2. Какова роль теории вероятностей, математической статистики в эконометрике?
2.3. Каков специальный математический смысл термина «регрессия», что является регрессией в статистическом смысле?
2.4. Как принято интерпретировать понятие «парная регрессия»? Что принято считать уравнением, кривой (линией) регрессии, регрессионной переменной, регрессором?
2.5. Как связаны строгая функциональная зависимость между переменными и соответствующая «парная регрессия»? В чем проявляется оптимальная вероятностно-статистическая природа модели парной (множественной) регрессии?
2.6. Как связаны детерминированная и случайная величины в рамках модели парной линейной регрессии? Какова природа возможных ошибок в оценивании с помощью модели парной линейной регрессии? Какие гипотезы сопровождают стандартные и нестандартные условия приложений модели парной линейной регрессии? Что означают: гетероскедастичность, автокорреляция остатков?
2.7. В чём специфика эконометрической модели временных рядов?
2.8. Что собой представляет эконометрическая модель «система одновременных уравнений»?
2.9. Каковы основные этапы эконометрического моделирования?