Задачи корреляционно-регрессионного анализа и моделирования
Понятие о корреляционной связи.
Условия применения и задачи корреляционно-регрессионного анализа и моделирования.
Парная регрессия и корреляция в эконометрических исследованиях.
Парная линейная корреляция
Применение нелинейных моделей в эконометрических исследованиях
Литература: 1,2,3, 4,8,10,11,12,13.
Понятие о корреляционной связи
Диалектический и исторический материализм рассматривают явления и процессы, происходящие в природе и в обществе в тесной связи и взаимозависимости. Это обусловлено тем, что явления и процессы объективного мира органически связаны между собой, зависят друг от друга и обуславливают друг друга.
Поэтому одной из важнейших задач статистической науки является изучение, измерение и количественное выражение взаимосвязей между явлениями общественной жизни, установленными на основе качественного анализа.
Изучение взаимосвязей статистика решает с помощью особых методов, видоизменяющихся в зависимости от характера исходного материала и целей познания. Невозможно управлять явлениями, предсказывать их развитие без изучения характера, силы и других особенностей связей.
Методы исследования, измерения связей составляют важную часть методологии научного исследования, в т.ч. и статистического.
Между различными явлениями и их признаками различают два типа связей:
· Функциональную (четко детерминированную);
· Статистическую (стохастически детерминированную).
Определение различия этих типов связей возможно тогда, когда они получают математическую формулировку в форме уравнения связи двух переменных.
Если с изменением значения одной из переменных вторая изменяется строго определенным образом, т.е значению одной переменной обязательно соответствует одно или несколько точно заданных значений другой переменной, связь между ними является функциональной.
Функциональная связь двух величин возможна лишь при условии, что вторая из них зависит только от первой и ни от чего более.
В реальной природе, а тем более в социально-экономических процессах этого быть не может.
Стохастически детерминированная связь не имеет ограничений и условий, присущих функциональной связи. Если с изменением значения одной из переменных вторая может в определенных пределах принимать любые значения с некоторыми вероятностями, но ее средние значения или другие статистические характеристики изменяются по определенному закону – связь является статистической. При статистической связи разным значениям одной переменной соответствуют разные распределения значений другой переменной.
Регрессионная модель – это функция, описывающая зависимость между количественными характеристиками социально-экономических систем. Они строятся в тех случаях, когда известно, что зависимость между факторами существует и требуется получить ее математическое описание.
Связь, при которой каждому значению аргумента соответствует не одно, а несколько значений функций и между аргументом и функцией нельзя установить строгой зависимости, называется корреляционной.
Корреляционная зависимость проявляется только в средних величинах и выражает числовое соотношение между ними в виде тенденции к возрастанию или убыванию одной переменной величины при возрастании или убывании другой.
Корреляционная связь между признаками возникает как:
Ø Причинная зависимость результативного признака (его вариации) от вариации факторного признака;
Ø Корреляционная связь между двумя следствиями общей причины;
Ø Взаимосвязь признаков, каждый из которых и причина и следствие.
Условия применения и задачи корреляционно-регрессионного анализа и моделирования
1. наличие данных по достаточно большой совокупности явлений. Это необходимо для эффективного взаимопогашения случайных отклонений от закономерного характера связи признаков (закон больших чисел).
принято считать, что число наблюдений должно быть не менее, чем в 5-6 раз, а лучше – не менее, чем в 10 раз больше числа факторов.
2. условие, обеспечивающее надежное выражение закономерности в средней величине. Это достаточная качественная однородность совокупности.
3. необходимость подчинения распределения единиц совокупности по результативному и факторным признакам нормальному закону распределения. Это вызвано применением метода наименьших квадратов при расчете параметров уравнения регрессии. Только при нормальном распределении метод наименьших квадратов дает оценку параметров, отвечающую принципам максимального правдоподобия.
4. спорным является вопрос об условии применения корреляционного анализа к функциональным связям. Обычно используется индексный метод анализа (пример, у – выручка, х1 – объем продаж, х2 – цена). В реальности количество продаж и цена не являются вполне независимыми друг от друга.
Задачи корреляционно-регрессионного анализа и моделирования
1. Измерение параметров уравнения регрессии, выражающего связь средних значений зависимой переменной со значениями независимой переменной (зависимость средних величин результативного признака от значений одного или нескольких факторных признаков. Уравнение корреляционной связи измеряет зависимость между вариацией результативного признака и вариацией факторного признака.
2. измерение тесноты связи двух (или большего числа) признаков между собой.
Меры тесноты связи измеряют долю вариации результативного признака, которая связана корреляционно с вариацией факторного признака (признаков).
Нельзя трактовать корреляцию признаков как связь их уровней. Метод корреляционно-регрессионного анализа не может объяснять роли факторных признаков в создании результативного признака.
Задачи, имеющие не формально математический, а содержательный характер:
3. Выделение важнейших факторов, влияющих на вариацию результативного признака в совокупности.
4. Оценка хозяйственной деятельности по эффективности использования имеющихся факторов производства. Решается путем расчета для каждой единицы совокупности тех величин результативного признака, которые были бы получены при средней по совокупности эффективности использования факторов и сравнения их с фактическими результатами производства.
5. Прогнозирование возможных значений результативного признака при задаваемых значениях факторных признаков. Решается путем подстановки ожидаемых, или планируемых значений факторных признаков в уравнение связи и вычисление ожидаемых значений результативного признака.
6. подготовка данных, необходимых в качестве исходных для решения оптимизационных задач.
При решении каждой из названных задач нужно учитывать особенности и ограничения корреляционно-регрессионного метода. Всякий раз необходимо специально обосновать возможность причинной интерпретации уравнения как объясняющего связь между вариацией фактора и результата.
(Трудно обеспечить раздельную оценку влияния каждого из факторов. В этом отношении корреляционные методы глубоко противоречивы. С одной стороны, их идеал – измерение чистого влияния каждого фактора. С другой стороны, такое измерение возможно при отсутствии связи между факторами и случайной вариацией признаков. А тогда связь является функциональной, и корреляционные методы анализа излишне. В реальных системах связь всегда имеет статистический характер, и тогда идеал методов корреляции становится недостижимым. Это не означает, что эти методы не нужны. Данное противоречие означает недостижимость абсолютной истины в познании реальных связей. Приближенный характер любых результатов корреляционно-регрессионного анализа не является поводом для отрицания их полезности. Всякая научная истина – относительна. Забыть об этом и абсолютизировать параметры регрессионных уравнений, меры корреляции было бы ошибкой, так же как и отказаться от использования этих мер.)