Типы данных. Виды переменных
При моделировании экономических процессов используют два типа данных: пространственные и временные.
Пространственные данные – это данные по какому-либо экономическому показателю (признаку), или совокупности показателей (признаков), полученные от разных однотипных объектов (фирм, регионов, отраслей и т.п.), но относящиеся к одному и тому же моменту времени (пространственный срез). Например, данные об объеме производства, численности работников, доходе разных фирм в один и тот же период.
Временные данные – это данные, характеризующие один и тот же объект в различные моменты или периоды времени (временной срез). Например, ежеквартальные данные о средней заработной плате, инфляции, индексе потребительских цен, данные о национальном доходе, числе занятых за последние годы. Этот тип данных обычно представляют в виде временных рядов.
Отличительной особенностью временных данных является их естественная упорядоченность во времени. Кроме того, наблюдения в близкие моменты времени часто бывают зависимыми.
Исходная информация для построения эконометрических моделей представляет собой данные по совокупности признаков (двух или более), характеризующих объект исследования. Признаки, как правило, взаимосвязаны и могут выступать в одной из двух ролей: в роли результативного признака (зависимая переменная y) или в роли факторного признака (независимая переменная x), значения которого определяют значение результативного признака.
В эконометрике принято результативный признак называть объясняемой переменной, а факторный признак – объясняющей переменной.
Переменные, участвующие в эконометрической модели, можно отнести к одному из следующих видов:
экзогенные (независимые, x) – переменные, значения которых задаются извне, автономно, в определенной степени они являются управляемыми или планируемыми;
эндогенные (зависимые, y) – переменные, значения которых определяются внутри модели, в существенной мере под воздействием экзогенных переменных;
лаговые – экзогенные или эндогенные переменные, значения которых измерены в прошлые моменты времени, и находятся в эконометрической модели вместе с текущими переменными. Например: yt – текущая эндогенная переменная, yt-1, yt-2 – лаговые эндогенные переменные;
предопределенные – переменные, выступающие в роли факторных признаков, или объясняющие переменные. К ним относятся лаговые (xt-1) и текущие (xt) экзогенные переменные, а также лаговые эндогенные переменные (yt-1).
Эконометрическая модель любого типа предназначена для объяснения поведения эндогенных (текущих) переменных в зависимости от значений экзогенных и лаговых эндогенных переменных.
Виды зависимостей
В экономических исследованиях одной из основных задач является анализ зависимости между переменными. Зависимость может быть функциональной, статистической, корреляционной.
Функциональная зависимость задается в виде точной формулы, в которой каждому значению одной переменной соответствует вполне определенное значение другой.
В экономике функциональная зависимость между переменными проявляется редко. В большинстве случаев имеют место зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной. Иными словами, каждому значению одной переменной соответствует определенное (условное) распределение другой переменной. Такие зависимости называют статистическими.
Если каждому значению одной переменной соответствует определенное конечное условное математическое ожидание другой, то такая статистическая зависимость называется корреляционной. Таким образом, корреляционной зависимостью между двумя переменными называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.
Аналитическая формула корреляционной зависимости между переменными называется уравнением регрессии. Если эта формула линейна, то имеет место линейная регрессия. В противном случае – нелинейная.
При рассмотрении зависимости объясняемой переменной от одной объясняющей переменной говорят о парной регрессии. Зависимость от нескольких объясняющих переменных называют множественной регрессией.
Ковариация и корреляция
Введем понятия ковариации и корреляции, которые будут необходимы для изложения основ регрессионного анализа.
Теоретическая ковариация
Теоретической (генеральной) ковариацией случайных величин X и Y называют математическое ожидание произведения отклонений этих величин от их математических ожиданий, т.е.
. (1.1)
Свойства теоретической ковариации.
1. - альтернативное выражение для вычисления .
Следствие. Если случайные величины X и Y являются независимыми, то .
Вывод. Ковариация является мерой взаимосвязи между X и Y.
2. .
3. , где – теоретическая (генеральная) дисперсия случайной величины X
4. , где a = const.
5. ,где a = const.
6. Если , то .
7. .
Замечание.Для независимых случайных величин X и Y , поэтому .
Упражнение 1.1. Доказать, что .
Доказательство. По определению (1.1) имеем:
, что и требовалось доказать. При доказательстве использованы свойства математического ожидания случайных величин.
Выборочная ковариация
На практике не удается получить все данные по генеральной совокупности, и, как правило, теоретическая ковариация случайных величин X и Y неизвестна, но ее можно оценить (приближенно определить). Для ее оценки используют выборочную ковариацию, которую вычисляют по выборке объема n и обозначают .
Выборочной ковариацией случайных величин X и Y называется средняя арифметическая произведения отклонений этих величин от их средних, т.е.
= = . (1.2)
Свойства выборочной ковариации.
1. = = ,
где , .
2. = .
3. = , где – выборочная дисперсия случайной величины X.
4. = 0, где a = const.
5. = a , где a = const.
6. = ± .
7. Выборочная ковариация является смещенной (заниженной) оценкой теоретической ковариации, причем:
= .
Из свойства 7 следует, что в среднем за длительный период мы будем получать значения выборочной ковариации меньшие, чем теоретическая ковариация .
Упражнение 1.2. Доказать, что = .
Доказательство. По определению (1.2) имеем:
= = = = = , что и требовалось доказать.