Статистическая оценка коэффициента корреляции

4.2.1. Корреляционные зависимости. Основные задачи
корреляционного анализа

В природе связи между различными явлениями сложны и многообразны. В естественных науках часто идет речь о функциональной зависимости, когда каждому значению одной переменной соответствует вполне определенное значение другой переменной. Например, функциональная зависимость между радиусом круга R и его площадью S выражается формулой Статистическая оценка коэффициента корреляции - student2.ru ; функциональная зависимость между температурой T, давлением P и объемом V одного моля идеального газа выражается формулой Клайперона: Статистическая оценка коэффициента корреляции - student2.ru , где R – газовая постоянная.

В экономической науке также часто имеют дело с функциональными зависимостями. Различные экономические показатели как на микро-, так и на макроуровне не являются независимыми, а связаны между собой функциональной зависимостью. Например, цена какого-либо товара и величина спроса на этот товар; объем производства и прибыль фирмы; инфляция и безработица и т.д.

Однако не всякая зависимость между двумя переменными является функциональной. В реальном мире многие явления природы происходят в обстановке действия многочисленных факторов, влияние каждого из которых ничтожно, а число их велико. В этих случаях связь теряет свою строгую функциональность. Физическая система, например, переходит из одного состояния в другое, но не строго определенное, а в одно из возможных для нее состояний. Здесь речь может идти лишь о так называемой стохастической (вероятностной, статистической) зависимости.

Например, рост человека и его вес не связаны функциональной зависимостью. По данному росту человека нельзя найти его вес, и наоборот. Тем не менее, зависимость между ростом человека и его весом существует, но является стохастической. Или другой пример, между высотой и толщиной ствола одной и той же породы деревьев существует связь, но эта связь также не является функциональной. Таких примеров можно привести очень много: количество внесенных в почву удобрений и урожайность; возраст коров и величина удоя и т.д.

В экономике также в основном имеют дело со стохастическими зависимостями, поскольку на интересующий нас тот или иной показатель кроме явно учитываемых переменных влияют еще и много других, не учтенных явно в модели. Это обуславливает стохастическую природу многих экономических переменных. Например, рост дохода ведет к увеличению потребления; снижение процентной ставки увеличивает инвестиции; увеличение валютного курса сокращает чистый экспорт. Все эти зависимости – стохастические, поскольку по значениям одной переменной нельзя определить точное значение другой переменной.

Стохастическая связь состоит в том, что каждому значению независимой переменной X соответствует множество значений другой случайной величины Y. Поскольку совокупность значений случайной величины характеризуется функцией распределения, то определение стохастической зависимости можно дать следующим образом:

Зависимость между переменными X и Y называется стохастической, если различным значениям одной из них соответствуют различные распределения другой.

Стохастическая зависимость проявляется в том, что при изменении одной из величин изменяется математическое ожидание (среднее значение) другой, в таких случаях говорят о корреляционной зависимости. Например, очевидно, что при увеличении высоты деревьев в среднем растут и диаметры стволов. Очевидно, что корреляционная зависимость является частным случаем стохастической связи. Если с изменением значений переменной X среднее значение переменной Y не изменяется закономерным образом, но закономерно изменяются другие статистические характеристики (показатели вариации, асимметрии, эксцесса и т.п.), то такая зависимость не является корреляционной, хотя и является стохастической.

Знание корреляционной зависимости между случайными величинами имеет большое практическое значение: с ее помощью можно прогнозировать значение зависимой случайной переменной в предположении, что независимая переменная примет определенное значение. Однако, поскольку понятие корреляционной зависимости относится к случайным величинам, прогнозы не могут быть безошибочными. Применяя некоторые вероятностные методы, можно вычислить вероятность того, что ошибка прогноза не выйдет за определенные границы.

В основе математической теории корреляционных зависимостей лежит предположение о том, что изучаемые явления подчиняются определенным вероятностным закономерностям, которые описываются многомерными распределениями.

Возникновение статистической зависимости обусловлено тем, что зависимая переменная подвержена влиянию различных неконтролируемых или неучтенных факторов, а также тем, что измерения значений переменных неизбежно сопровождаются случайными ошибками. В экономической науке также редко имеют дело с функциональными зависимостями, поскольку на интересующей нас тот или иной показатель кроме явно учитываемых переменных влияют еще и много других, не учтенных явно в модели. Это обуславливает стохастическую природу многих экономических переменных.

В экономической теории и практике ограничиваются тем или иным кругом величин (объясняющие переменные), которые определяют главные текущие изменения рассматриваемой величины. Однако всегда существует воздействие большого числа других, менее важных или трудно идентифицируемых факторов, приводящих к отклонениям значений объясняющей (зависимой) переменной от конкретной формулы ее связи с объясняющими переменными, сколько бы точной эта формула не была.

Основная задача корреляционного анализа – выявление связи между случайными величинами, разработка числовых показателей для характеристики этой связи и их оценка. При проведении корреляционного анализа нужно ответить на следующие вопросы:

· как выбрать (с учетом специфики и природы анализируемых переменных) подходящий измеритель корреляционной связи (коэффициент корреляции, корреляционное отношение, ранговый коэффициент корреляции и т.п.)?

· как оценить (с помощью точечной и интервальной оценок) его числовое значение по имеющимся выборочным данным?

· как проверить гипотезу о том, что полученное значение анализируемого измерителя связи действительно свидетельствует о наличии корреляционной связи (или, как говорят, проверить исследуемую корреляционную характеристику на статистическое значимое её отличие от нуля)?

При исследовании зависимостей между переменными мы должны в первую очередь дать ответ на вопрос: а существует ли такая зависимость или анализируемые переменные статистически независимы? И только после утвердительного ответа на этот вопрос заняться выявлением вида математической формы этой зависимости, но это уже задача регрессионного анализа.

Наши рекомендации