Парная регрессия и корреляция в эконометрических исследованиях

Простая (парная) регрессия представляет собой регрессию между двумя переменными – у и х, т.е. модель вида

y = Парная регрессия и корреляция в эконометрических исследованиях - student2.ru (x),

где у – зависимая переменная (результативный признак);

х – независимая, или объясняющая, переменная (признак-фактор).

Различают линейные и нелинейные регрессии.

Линейная регрессия: y = a+b*x+e.

Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам:

§ полиномы разных степеней y = a+b1*x+b2*x2+b3*x3+e

§ равносторонняя гипербола y = a+b/x+e
и регрессии, нелинейные по оцениваемым параметрам

§ степенная y = a*xb *e

§ показательная y = a*bx *e

§ экспоненциальная y = e a+b*x *e

Любое эконометрическое исследование начинается со спецификации модели, т.е. с формулировки вида модели, исходя из соответствующей теории связи между переменными: из всего круга факторов, влияющих на результат, необходимо выделить наиболее существенно влияющие факторы; кроме того, необходимо знать, какие остальные факторы предполагают неизменными, поскольку возможно, в дальнейшем их придется учесть в модели и от простой регрессии перейти к множественной.

Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем в целом по совокупности наблюдений. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина у складывается из двух слагаемых: y = ŷ+e,

где y – фактическое значение результативного признака;

ŷ – теоретическое значение результативного признака, найденное исходя из соответствующей математической функции связи у и х, т.е. из уравнения регрессии;

e – случайная величина, характеризующая отклонение реального значения результативного признака от теоретического, найденного по уравнению регрессии.

Случайная величина e называется также возмущением.Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели порождено тремя источниками:

1. Спецификацией модели, От правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в большей мере теоретическое значение результативного признака ŷx подходят к фактическим данным y. К ошибкам спецификации будут относиться не только неправильный выбор математической функции, но и недоучет в уравнении регрессии какого-либо существенного фактора, т.е. использование парной регрессии вместо множественной.

2. Выборочным характером исходных данных. Ошибки выборки имеют место в силу неоднородности данных в исходной статистической совокупности. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупности единицы с аномальными значениями исследуемых признаков. И в этом случае результаты регрессии представляют собой выборочные характеристики.

3. Ошибки измерения. Представляют наибольшую опасность (ошибки спецификации можно уменьшить, изменяя форму модели; выборки – увеличивая объем исходных данных):

☺ инструментальные ошибки, возникающие из-за дефектов измерительной аппаратуры;

☺ связанные с состоянием внешней среды, в которой производятся измерения;

☺ обусловленные индивидуальными особенностями экспериментатора (субъективные);

☺ вносимые самим методом постановки эксперимента из-за приближенности теоретических соотношений, связывающих наблюдаемые на опыте величины с величинами, непосредственно интересующими экспериментатора;

☺ сознательное искажение исходной информации (баланс предприятия, достоверность которых не подтверждается и т.д.)

Предполагая, что ошибки измерения сведены к минимуму, основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели.

В парной регрессии выбор вида математической функции y = Парная регрессия и корреляция в эконометрических исследованиях - student2.ru (x) может быть осуществлен тремя методами:

- графический – достаточно нагляден, основан на поле корреляции

- аналитический (т.е. исходя из теории изучаемой взаимосвязи), основан на изучении материальной природы связи исследуемых признаков.

- экспериментальный, выбор типа уравнения обычно осуществляется при обработке информации на компьютере путем сравнения величины остаточной дисперсии, рассчитанной при различных моделях: Dост.= Парная регрессия и корреляция в эконометрических исследованиях - student2.ru

Величина остаточной дисперсии характеризует влияние прочих не учтенных в модели факторов. Чем меньше величина остаточной дисперсии, тем в меньшей степени наблюдается влияние прочих не учитываемых в модели факторов и данное уравнение регрессии лучше подходит к исходным данным.

Если величина остаточной дисперсии примерно одинакова для различных моделей, то предпочтение отдается более простым функциям, т.к. они в большей степени поддаются интерпретации и требуют меньшего объема наблюдений.

Наши рекомендации