Функциональные и статистические связи
Связи между различными явлениями в природе сложны и многообразны, однако их можно определенным образом классифицировать.
Одной из форм проявления закономерностей, особенно в социально-экономических процессах, является статистическая закономерность (стохастическая, вероятностная).
Функциональная зависимость двух величин означает, что каждому значению независимой величины соответствует строго определенное значение зависящей от нее величины. Это может быть, например, зависимость между давлением и объемом газа. Функционально какая-либо величина может зависеть от нескольких аргументов.
Статистическая зависимость, следовательно, не столь жесткая, как функциональная. Так, например, при одном и том же объеме товарооборота издержки обращения могут быть различными; при одинаковых основных фондах и численности работников производительность труда на однотипных предприятиях может существенно различаться; при одном и том же количестве внесенных удобрений урожайность культуры может быть различной, поскольку она определяется не только количеством удобрений, но и осадками, структурой почвы, качеством ее обработки и многими другими факторами, которые нельзя количественно учесть в полной мере.
Знание статистической зависимости между случайными переменными имеет большое практическое значение: с ее помощью можно прогнозировать значение зависимой случайной переменной в предположении, что независимая переменная примет определенное значение. Частным случаем статистической зависимости является корреляционная зависимость.
Корреляционной зависимостью считается такая статистическая зависимость, когда условное математическое ожидание величины Y функционально зависит от случайной величины Х, т. е.
Данное уравнение называется моделью регрессии, функция (х) - модельной функцией регрессии, график этой функции - линией регрессии. Если (х) - линейная функция, то модель называется линейной. Для отыскания уравнений регрессии необходимо знать закон распределения двумерной случайной величины (Х,Y).
Корреляционные зависимости изучаются методами корреляционного и регрессионного анализа.
Основная задача корреляционного анализа - выявление наличия связи между случайными величинами и оценка ее тесноты.
Основная задача регрессионного анализа - нахождение статистической или регрессионной зависимости между переменными и ее изучение.
Процесс корреляционного и регрессионного анализа подразделяется на следующие этапы:
- предварительная обработка статистических данных и выбор фактор-признаков;
- оценка тесноты связи между признаками;
- определение формы взаимосвязи между результирующим показателем и фактор-признаками;
- вычисление оценок параметров статистической модели;
- проверка адекватности модели, надежности оценок параметров.
В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную)и множественнуюрегрессию.
Парная регрессия – регрессия между двумя переменными yи x, т.е. модель вида
где y– зависимая переменная (результативный признак);
x – независимая, объясняющая переменная (признак-фактор).
Спецификация модели – формулировка вида модели, исходя из соответствующей теории связи между переменными. Со спецификации модели начинается любое эконометрическое исследование. Иными словами, исследование начинается с теории, устанавливающей связь между явлениями.
Прежде всего, из круга факторов, влияющих на результативный признак, необходимо выделить наиболее существенно влияющие факторы. Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией
где yj — фактическое значение результативного признака;
yxj —теоретическое значение результативного признака.
— случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.
Случайная величина ε называется также возмущением. Она включает влияние неучтенных в модели факторов, случайных ошибок и особенностей измерения.
От правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в большей мере теоретические значения результативного признака подходят к фактическим данным у.
К ошибкам спецификации относятся неправильный выбор той или иной математической функции для , и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множественной.
Наряду с ошибками спецификации имеет место ошибка выборки - исследователь чаще всего имеет дело с выборочными данными при установлении закономерной связи между признаками. Ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками.
Основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели. В парной регрессии выбор вида математической функции может быть осуществлен тремя способами: графическим; аналитическим(исходя из теории изучаемой взаимосвязи) и экспериментальным.
Графический метод основан на поле корреляции. Аналитический метод основан на изучении материальной природы связи исследуемых признаков.Экспериментальный метод осуществляется путем сравнения величины остаточной дисперсии Dост, рассчитанной при разных моделях. Если фактические значения результативного признака совпадают с теоретическими то Docm =0. Если имеют место отклонения фактических данных от теоретических то
Чем меньше величина остаточной дисперсии, тем лучше уравнение регрессии подходит к исходным данным.
Если остаточная дисперсия оказывается примерно одинаковой для нескольких функций, то на практике предпочтение отдается более простым видам функций, ибо они в большей степени поддаются интерпретации и требуют меньшего объема наблюдений. Число наблюдений должно в 6 — 7 раз превышать число рассчитываемых параметров при переменной х.