Проверка значимости коэффициента множественной корреляции осуществляется на основе F-критерия Фишера
Гипотеза о значимости коэффициента множественной корреляции подтверждается, если Fрасч>Fкр (при соответствующем уровне значимости 1% или 5% и числе степеней свободы n1 =2 –число степеней свободы числителя и n2=n-3- число степеней свободы знаменателя).
Совокупный индекс множественной корреляции характеризует тесноту связи между результативным признаком и всеми факторами при криволинейной зависимости:
- дисперсия результативного признака под влиянием факторов, включенных в модель;
-остаточная дисперсия результативного признака, вызванная влиянием не учтенных моделью факторов. При линейной форме связи совокупный коэффициент и индекс множественной корреляции равны между собой.
Взаимосвязи между признаками анализируются на материале выборочных наблюдений. Поэтому для проверки того, что полученные зависимости носят закономерный, а не случайный характер, оценивается значимость показателей корреляции и регрессии с помощью критериев t-Стьюдента и F-Фишера.
Корреляционно-регрессионный анализ служит для оценки показателей бизнес-плана и нормативных экономических показателей. Дает возможность для краткосрочного прогнозирования развития производства предприятий. Уравнение множественной регрессии позволяет найти теоретическое, возможное значение результативного показателя при определенных значениях факторных признаков. Задаваясь средними или лучшими значениями факторов по совокупности предприятий, можно установить потенциально возможный уровень результативного показателя, что раскрывает резервы предприятия по улучшению экономической деятельности.
Пример 2. Рассчитаем параметры уравнения регрессии и проанализируем показатели тесноты связи производительности труда y (млн. руб./чел.) работников телефонной связи у в зависимости от факторов х1- уровнями использования каналов (млн.мин./кан.) и x2 - автоматизации (отн. ед.) телефонных каналов по 10 филиалам ОАО «Электросвязь» (см. табл.).
Расчетные величины для определения параметров уравнения линейной регрессии Производительности труда у (млн. руб./чел.) от уровняиспользования каналов ММТС х (млн. мин/кан.) и уровня автоматизации телефонных каналов ММТС х2 (отн. ед)
№ п/п | Y | X1 | X2 | Y2 | X12 | X22 | yx1 | yx2 | x1x2 | yx | y-yx | (y-yx)2 |
10,0 | 0,5 | 0,25 | 10,03 | 0,03 | 0,0009 | |||||||
10,5 | 0,6 | 110,25 | 0,36 | 199,5 | 6,3 | 11,4 | 10,62 | 0,12 | 0,0144 | |||
10,8 | 0,8 | 116,64 | 0,64 | 226,8 | 8,64 | 16,8 | 10,80 | 0,0 | 0,0 | |||
11,0 | 0,7 | 0,49 | 220,0 | 7,7 | 14,0 | 11,21 | 0,21 | 0,0441 | ||||
11,3 | 0,6 | 127,69 | 0,36 | 214,7 | 6,78 | 11,4 | 10,62 | 0,68 | 0,4624 | |||
11,8 | 0,8 | 139,24 | 0,64 | 259,6 | 9,44 | 17,6 | 12,13 | 0,33 | 0,1089 | |||
12,0 | 0,7 | 0,49 | 240,0 | 8.,4 | 14,0 | 11,21 | 0,79 | 0,6241 | ||||
12,4 | 0,8 | 153,76 | 0,64 | 297,6 | 9,92 | 19,2 | 12,79 | 0,39 | 0,1521 | |||
13,0 | 0,7 | 0,49 | 286,0 | 9,1 | 15,4 | 1,87 | 1,13 | 1,2769 | ||||
13,2 | 0,9 | 174,24 | 0,81 | 343,2 | 11,88 | 23,4 | 13,72 | 0,52 | 0,2704 | |||
Итого | 116,0 | 210,0 | 7,1 | 1355,82 | 5,17 | 2467,4 | 83,16 | 152,2 | 116,0 | - | 2,9542 |
Для расчета параметров линейного уравнения двухфакторной регрессии вида составим систему нормальных уравнений:
Решение этой системы дает следующие результаты: а0 = 2,77; а1 = 0,33; а2 = 2,63.
Уравнение множественной регрессии, выражающей зависимость производительности труда у от уровня использования каналов х1 и уровня их автоматизации х2 имеет вид:
Коэффициенты регрессии показывают степень влияния каждого из факторов на производительность труда: увеличение продолжительности соединений 1 млн. мин в расчете на 1 канал ведет к росту производительности труда одного работника на 0,33 млн. руб./чел. повышение доли автоматической связи в общем числе каналов на 0,1, или 10 %, способствует повышению производительности труда на 2,63 млн. руб./чел..
Частные коэффициенты эластичности составляют соответственно Э1 = 0,33•21,1/11,6 = 0,6; Э2 = 2,63-0,71/11,6 = 0,16. Они показывают, что по абсолютному приросту наибольшее влияние на производительность труда оказывает первый фактор: увеличение уровня использования каналов на 1 % вызывает рост производительности труда на 0,6 %, тогда как повышение уровня автоматизации каналов на 1 % способствует росту производительности труда только на 0,16 %. Расчет b-коэффициентов:
b1=0,33·2,34/1,02 = 0,76; b2=2,63·0,113/1,02 = 0,29
также подтверждает вывод, что наибольшие резервы роста производительности труда заложены в первом факторе.
Для оценки тесноты связи рассчитаем совокупный коэффициент множественной корреляции R, исходя из следующих коэффициентов парной корреляции:
Он указывает на весьма тесную связь производительности труда с обоими факторами. Совокупный коэффициент множественной детерминации R2 = 0,711 свидетельствует о том, что 71,1 % вариации производительности труда обусловлены факторами х1 и х2. Значит, выбранные факторы существенно влияют на производительность труда и могут быть включены в модель.
Проверим значимость коэффициента множественной корреляции:
По таблице приложения находим, что Fкр=4,74 (ри a=0,05 n1 =2 и n2=10-3=7). Т.о. Fрасч>Fкр, следовательно, гипотеза о значимости множественного коэффициента корреляции подтверждается.
По полученному уравнению регрессии рассчитаем выровненные значения (см. табл.1, отклонения фактических значений производительности труда от теоретических (у — ) и остаточную дисперсию = 2,9542/10 = 0,295. Совокупный индекс множественной корреляции составляет его значение, естественно, совпадает со значением совокупного коэффициента множественной корреляции.
Проведение анализа корреляции и построение многофакторных уравнений регрессии сопряжены с соблюдением определенных условий и требований к построению моделей, с последовательным выполнением основных этапов и предполагает применение вычислительной техники.
Чтобы уравнение регрессии достаточно адекватно отражало (аппроксимировало) реальные моделируемые социально-экономические процессы или явления должны быть соблюдены следующие условия и требования:
• совокупность исследуемых показателей должна быть однородной по условиям формирования результативного и факторных признаков (выделяющиеся наблюдения следует исключить из совокупности);
• результативный признак должен подчиняться нормальному закону распределения, факторные — быть близки к нормальному распределению. Если объем совокупности достаточно большой (п > 50), то нормальность распределения может быть подтверждена на основе расчета и анализа критериев Пирсона, Ястремского, Колмогорова, Боярского и др.;
• моделируемое явление или процесс описывается количественно (параметры должны иметь цифровое выражение) одним или несколькими уравнениями причинно-следственных связей. Причинно-следственные связи целесообразно описывать линейными или близкими к линейной форме зависимостями;
• постоянство территориальной и временной структуры изучаемой совокупности, отсутствие количественных ограничений на параметры модели;
• достаточность единиц совокупности: их количество должно быть в несколько раз больше, чем число факторов, включаемых в модель. На каждый фактор должно приходиться, как минимум, 5-6 наблюдений, т.е. число факторных признаков должно быть в 5-6 раз меньше объема изучаемой совокупности. Основными этапами корреляционно-регрессионного анализа являются;
• предварительный теоретический анализ сущности явления, позволяющий установить причинно-следственные связи между признаками, выбрать наиболее важные факторы, решить вопрос об измерении результативного и факторных признаков;
• подготовка исходной информации, включающая вопросы достаточности единиц наблюдения, однородности совокупности изучаемых признаков и близости их распределения к нормальному;
• выбор формы связи между результативным признаком и факторами на основе перебора нескольких аналитических функций;
• исследование тесноты связи между результативным признаком и факторами, а также между факторами на основе построения матрицы парных линейных коэффициентов корреляции и отсев мультиколлинеарных факторов;
• отбор существенных (значимых) факторов, включаемых в многофакторную модель—уравнение множественной регрессии, на основе соответствующих статистических методов;
• расчет параметров уравнения множественной регрессии и оценка значимости отобранных факторов, коэффициентов корреляции регрессии с помощью критериев t-Стьюдента и F-Фишера;
• анализ полученных результатов.
Взаимосвязи между признаками анализируются, как правило, на материале выборочных наблюдений, поэтому для проверки того, что полученные зависимости носят закономерный, а не случайный характер, оценивается значимость (существенность) показателей корреляции и регрессии. Корреляционно-регрессионный анализ служит для оценки показателей бизнес-плана и нормативных уровней экономических показателей, отражающих эффективность использования производственных ресурсов, выявления имеющихся резервов производства, проведения сравнительного анализа, оценки потенциальных возможностей предприятий, краткосрочного прогнозирования развития производства. Уравнение множественной регрессии позволяет найти теоретическое, возможное значение результативного показателя при определенных значениях факторных признаков. Задаваясь средними или лучшими значениями факторов по совокупности предприятий, можно установить потенциально возможный уровень результативного показателя. Данный подход лежит в основе нормирования финансовых показателей, затрат на производство услуг связи, мониторинга результатов деятельности филиалов организаций связи. Сопоставление фактических уровней факторов со средними или лучшими их значениями раскрывает резервы предприятия по улучшению экономической деятельности.