Понятие множественной корреляции
Уровень социально-экономических явлений складывается под воздействием целого ряда факторов, часто взаимодействующих между собой. Попытка определить совокупное влияние нескольких признаков-факторов на признак-результат получила название множественной корреляции.
Если в случае парной корреляции необходимо получить уравнение регрессии y = f(x), то при исследовании множественной корреляции это уравнение имеет вид:
y = f(x1,x2,x3…xm),
где m – число исследуемых признаков-факторов.
Наиболее сложный момент – это отбор признаков-факторов. Он производится в несколько этапов:
1. На основе теоретического (логического) анализа выбираются факторы, которые могут влиять на признак-результат и интересуют исследователя.
Например: y − производительность труда;
x1 − фондовооружённость труда;
x2 − фондоотдача;
x3 − коэффициент текучести;
x4 − заработная плата;
x5 − коэффициент механизации труда и т.д.
2. Определяются парные коэффициенты корреляции:
… | |||
… | |||
… | |||
… | … | … | … |
В многофакторную модель включаются только те факторы, по которым ryx указывает наличие достаточной связи, то есть > 0,3.
Определение – это проверка факторов на мультиколлинеарность: если, например, = -0,875, то из числа факторов мы должны исключить либо Ктек либо заработную плату, так как они тесно взаимосвязаны, то есть мультиколлинеарны.
3. Из числа признаков-факторов исключаются те, которые связаны между собой и признаком-результатом функциональной зависимостью.
Например:
, т.е. .
Выбираем либо x2 либо x1.
4. Строятся различные варианты многофакторных моделей, и если они противоречат теории или логике, производится поочерёдное исключение факторов и выбирается наиболее приемлемая модель.
Экономическая интерпретация полученного уравнения регрессии производится по коэффициентам а1,а2,а3…, которые указывают размер изменения признака-результата при изменении j-го фактора на единицу.
Оценка тесноты связи – по коэффициенту множественной корреляции R.
В случае 2-факторной модели:
,
R, как и r, изменятся от 0 до 1.
Определяется и коэффициент детерминации R2.
Как правило, расчёты выполняются на ЭВМ по стандартным программам. Задача исследователя состоит в следующем:
а) правильное определение факторов;
б) набор необходимого количества данных (иногда объём выборки определяют упрощённо: n = 8*m, то есть если 5 факторов, то значений y и x1,x2,x3,x4,x5 должно быть по 40);
в) умение выбрать модель, наиболее полно решающую задачи исследования и имеющую теоретическое (логическое) объяснение.
Практическое значение многофакторных моделей:
1) регулируя уровни x1,x2…xm , воздействуем на y;
2) модель показывает, изменение какого фактора даёт наиболее ощутимое изменение результата.