Однофазный корелляционно-регрессионный анализ
Корреляционно-регрессионный анализ заключается в построении модели зависимости в виде уравнения регрессии, приближенно выражающей зависимость результативного признака от одного или нескольких признаков-факторов. Одной из проблем, которую приходится решать, прежде чем приступить к построению уравнения регрессии, является выбор типа функции.
Нахождение теоретической формы связи. Если мы на корреляционном поле в нашем примере соединим, точки отрезками прямой, то получим ломаную линию с некоторой тенденцией к росту. Это будет эмпирическая линия связи. Изломы этой линии свидетельствуют о влиянии на признаку,прочих факторов, помимо признака х. Чтобы отвлечься (абстрагироваться) от влияния прочих факторов, нужно прибегнуть к выравниванию полученной эмпирической линии связи, к нахождению переменных средних (у), исчисленных в предположении функциональной зависимости у от х. Для этого, прежде всего, нужно установить теоретическую форму связи, т. е. выбрать определенный вид математического уравнения, наилучшимобразом отображающегохарактер изучаемой связи.
Выбор формы связи имеет решающее значение в корреляционном анализе. Все дальнейшие самые тщательные расчеты могут быть обесценены, если форма связи избрана неверно.
Зависимость признака у от х может быть, как мы говорили, прямой и обратной. Если с возрастанием х увеличивается у или с уменьшением х уменьшается у, то говорят, что связь между ними прямая, а корреляция положительная; если эта зависимость обратная (т. е. с увеличением х уменьшается у или с уменьшением х увеличивается у), то говорят, что существует отрицательная корреляция.
Кроме того, в зависимости от характера изменения у с изменением х связи могут быть линейными и криволинейными.
Уравнение линейной связи в общем виде можно написатьтак:
Криволинейная связь может быть весьма разнообразна. Приведем наиболее часто встречающиеся в экономическом анализе уравнения криволинейной зависимости:
уравнение гиперболы:
уравнение полулогарифмической кривой:
уравнение параболы второго порядка:
Выбор теоретической формы связи всегда связан с некоторой условностью, вызванной тем, что нужно находить форму функциональной зависимости, в то время как в жизни зависимость лишь в той или иной степени приближается к функциональной. Но, если зависимость довольно высокая, т. е. довольно близко приближается к функциональной, тогда именно теоретическая линия связи и ее параметры приобретают практическое значение, превращая теорию корреляции в хорошего помощника в плановых и экономических расчетах. Значит, когда связь высокая, есть смысл искать, и находить теоретическую линию связи.
При линейной форме уравнения применяется показатель тесноты связи – линейный коэффициент корреляции. Для практических вычислений при малом числе наблюдений (n£20) линейный коэффициент корреляции удобнее вычислять по следующей формуле
R=
Значение линейного коэффициента корреляции важно для исследования социально-экономических явлений и процессов, распределение которых близко к нормальному. Он принимает значения в интервале:
-1 £ r £ 1
Отрицательные значения указывают на обратную связь, положительные на прямую. При r =0 линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. И, наконец, при r = ±1, связь – функциональная.
Выравнивание по прямой. Разберем на примере зависимости, как находится теоретическое уравнение связи, имеющее линейный характер. Уравнение прямой в общем виде: Найти теоретическое уравнение связи - значит в данном случае определить параметры прямой. Эти параметры находят способом наименьших квадратов, который дает следующую систему нормальных уравнений для нахождения параметров прямой:
где п - численность совокупности; в нашем примере п =12.
Рассчитаем параметры линейного уравнения зависимости между расходами на рекламу и товарооборотом. (Для удобства расчетов показатели приведены в тыс. грн.)
x | y | x2 | yx | Yx | Y-Yx | |Y-Yx|×100% |
Y | ||||||
0,42 | 39,62 | 0,18 | 16,64 | 40,63 | -1,00 | 2,53 |
0,68 | 40,24 | 0,46 | 27,36 | 46,85 | -6,62 | 16,45 |
0,65 | 41,36 | 0,42 | 26,89 | 46,13 | -4,77 | 11,54 |
0,63 | 45,68 | 0,40 | 28,78 | 45,66 | 0,03 | 0,06 |
0,63 | 45,68 | 0,40 | 28,78 | 45,66 | 0,03 | 0,06 |
0,66 | 46,81 | 0,43 | 30,80 | 46,33 | 0,49 | 1,04 |
0,58 | 47,21 | 0,34 | 27,38 | 4,46 | 2,76 | 5,84 |
0,70 | 48,65 | 0,49 | 34,06 | 47,33 | 1,32 | 2,71 |
0,64 | 48,97 | 0,41 | 31,34 | 45,89 | 3,07 | 6,27 |
0,68 | 49,36 | 0,46 | 33,57 | 46,85 | 2,51 | 5,08 |
0,71 | 50,32 | 0,50 | 35,73 | 47,57 | 2,75 | 5,47 |
0,86 | 50,68 | 0,74 | 43,74 | 51,24 | -0,55 | 1,09 |
7,84 | 554,59 | 5,24 | 365,06 | х | х | 58,14 |
В результате расчетов мы получили =30,56, =23,95, следовательно уравнение зависимости имеет вид: У=30.56+23,95*Х
Прежде чем использовать полученную модель в дальнейших расчетах, необходимо установить адекватность модели. Для этого рассчитываем среднюю ошибку аппроксимации:
,
где Уф - фактические значения показателя, Ут - теоретические значения, найденные из уравнения.
Для этого, подставляя в уравнение регрессии фактические значения Х, находят теоретическое значение У, затем, для каждого значения рассчитывают:
, потом находят среднее значение .
При моделировании экономических показателей чаще всего допускается 5% ошибка. Модель считается адекватной (приемлемой для использования в расчетах), если .
В нашем примере ошибка аппроксимации =4,85%, следовательно, модель можно считать адекватной и использовать для моделирования показателей.
Так, например, мы можем вычислить, что при затратах на рекламу в размере 1000 грн. мы можем рассчитывать на объем товарооборота – 54518 грн.
В этом уравнении, исчисленном при условии функциональной зависимости у от х, если корреляционная связь высокая, параметр а при х имеет большое практическое значение. Этот параметр, который называется коэффициентом регрессии, характеризует, в какой мере увеличивается Ух с ростом величины х. В нашем примере прирост на 1 грн. рекламных расходов дает прирост объема продаж на 24грн.
Контрольные вопросы к теме
1. Какие виды взаимосвязей вам известны
2. В чем сущность балансового метода изучения взаимосвязей
3. Чем характеризуются функциональные связи
4. Что собой представляет корреляционная связь
5. Каковы основные задачи корреляционного анализа
6. В чем сущность метода сопоставления параллельных рядов
7. Что представляет собой однофакторный корреляционно-регрессионный анализ
8. Как используется метод группировок с целью выявления корреляционных зависимостей
9. В чем заключается графический метод выявления взаимосвязей
10. Какова последовательность нахождения теоретического уравнения связи, имеющего линейный характер.
11. Для чего рассчитывают среднюю ошибку аппроксимации:
12. Что характеризует коэффициентом регрессии
Тесты
1. Равенство: а+б=в+г представляет следующий вид взаимосвязей
a) факторный;
b) компонентный;
c) балансовый;
d) регрессионный.
2. Функциональные связи характеризуются:
a) обратной зависимостью между факторными и результативными признаками;
b) полным соответствием между изменением факторного признака и изменением результативной величины;
c) тем, что величина того или иного признака изменяется под влиянием целого комплекса факторов, мера влияния которых на результативный показатель различна;
d) тем, что они неполные.
3. Уравнение является:
a) Уравнением линейной связи;
b) уравнением полулогарифмической кривой;
c) Уравнением линейной связи;
d) уравнением параболы второго порядка.
4. средняя ошибка аппроксимации характеризует:
a) адекватность составленной модели взаимосвязи;
b) правильность расчета параметров уравнения регрессии;
c) тесноту взаимосвязи между рассматриваемыми явлениями;
d) коэффициент регрессии.
Опорный конспект