Метод корреляционно-регрессионного анализа. Корреляционное отношение и коэффициент корреляции
При исследовании корреляционных зависимостей решению подлежит широкий круг вопросов:
1) предварительный анализ свойств моделируемой совокупности;
2) установление факта наличия связи, определение ее направления и формы;
3) измерение степени тесноты связи между признаками;
4) построение регрессионной модели, т.е. нахождение аналитического выражения связи;
5) установление адекватности (соответствия) модели экспериментальным данным.
Для того, чтобы результаты корреляционного анализа нашли практическое применение и дали хороший результат, необходимо, чтобы выполнялись определенные требования в отношении объекта исследования и признаков-факторов. Требования к объекту исследования:
1) Однородность изучаемых единиц при корреляционном анализе.
Например, определение зависимости тех или иных технико-экономических показателей работы предприятия от определенных факторов.
Должны быть отобраны предприятия, выпускающие однотипную продукцию, имеющие одинаковый характер технологического процесса, тип используемого оборудования и т.п. Необходима также и количественная оценка однородности. Это можно сделать с помощью коэффициента вариации:
%, %.
2) Достаточное число наблюдений.
Требования в отношении признаков-факторов:
- выбирать наиболее важные из них.
Для этого следует провести качественный и количественный анализ с использованием, например, парного коэффициента корреляции, ранговых коэффициентов и т.п.;
- факторы должны быть независимы друг от друга;
- исключаются факторы, функционально связанные с результативным признаком;
- факторы должны иметь количественное выражение.
Кроме ранее разобранных методов для определения наличия и вида связи, можно использовать графический метод. По данным значениям факторного и результативного признака строят так называемое поле корреляций (это точечный график).
Соединив точки отрезками прямой получим линию, которая называется эмпирической линией регрессии.
Эмпирическая линия регрессии является ломаной линией, т.к. влияние прочих неучтенных причин в средних значениях результативного признака погашается не полностью. Но по этой линии можно получить приблизительное представление о линии связи.
Теоретической линией регрессии называется та линия, вокруг которой группируются точки корреляционного поля и которая указывает основную тенденцию развития (тренд).
Уравнение этой линии называется регрессионной моделью. Она может быть любой:
– прямая,
– парабола,
– гипербола и др.
Для построения регрессионных моделей нам необходимо найти их параметры. Так как теоретическая линия регрессии должна быть проведена таким образом, чтобы сумма отклонений эмпирических точек от теоретических была равна нулю, а сумма квадратов этих отклонений должна быть наименьшая, значит, следует воспользоваться методом наименьших квадратов.
По этому методу получаются системы уравнений для отыскания неизвестных параметров. Для уравнения прямой:
Параметр а1 – коэффициент регрессии. Он показывает, на сколько в среднем изменяется величина результативного признака при изменении факторного признака X на единицу.
Геометрически этот параметр оценивает степень наклона линии регрессии по отношению к оси ОХ.
Параметр а0 экономического смысла не имеет.
Коэффициент регрессии используют для определения коэффициента эластичности, который показывает, на сколько процентов в среднем изменится величина результативного признака У при изменении признака-фактора Х на 1%:
Для параболы система имеет вид.
Для гиперболы параметры а0 и а1 находят из системы уравнений вида: