Корреляционно – регрессионный метод изучения связи

Корреляционно-регрессионный метод позволяет решить две основные задачи:

1. определить аналитическую форму связи между факторным и результативным признаками

2. установить меру тесноты связи между признаками, т.е. определить, в какой мере вариация Х обуславливает вариацию У (У - результативный признак, Х - факторный признак).

Наиболее распространенными являются следующие виды корреляционной зависимости:

1) причина (фактор) непосредственно связана с результатом, т.е. Х®У, У=F(х)

2) следствие (результат) определяется не одним фактором а их комплексом, Х®

Х1®

Х2® У

Х3®

Хn®

В этом случае Y=F(x1, x2, x3,...,xn)

3) два и более следствий (результатов) вызваны одной общей причиной,

® У - потребление масла

® У1 - потребление творога

Х - доход ® У2 и т.п.

® У3

® Уn

В этом случае F(x)=Y1, Y2,..., Yn

Корреляционно регрессионный анализ позволяет выяснить на основе наблюдений над большим количеством фактов, как изменилась бы функция (У), в связи с изменением одного (интересующего нас) аргумента (Х), если бы все остальные аргументы не изменялись, и определить степень искажающего влияния прочих (неучтенных факторов) на исследуемую зависимость.

Корреляционно регрессионный метод включает несколько этапов:

‹ Применению предшествует выявление сущности социально-экономических явлений и проведение статистических наблюдений. проведение предварительного анализа данных (сводки, группировки данных).

Œ Постановка задачи и выбор факторных и результативных признаков на основе изучения взаимосвязи с помощью формально-статистического метода анализа. Цель наблюдения может быть шире, чем цель корреляционно-регрессионного анализа.

 Выбор формы связи между фактическим и результативным признаками.

Ž Измерение тесноты связи между фактическим и результативным признаками.

 Оценка результатов наблюдения, пояснение, анализ.

Выбранная форма связи должна отражать экономическую природу изучаемых явлений и быть по возможности простой.

Уравнение регрессии (функция связи) должно наилучшим образом аппроксимировать изучаемое явление.

Парная корреляция

Рассмотрим несколько случаев парной корреляции:

I. Линейная корреляция

Имеет место при равномерном изменении признака. Ломанная линия регрессии позволяет заключить, что уравнение прямой может являться в данном случае уравнением связи. После выбора уравнения связи задача заключается в нахождении параметров уравнения связи. Для их нахождения пользуются методом наименьших квадратов, который основывается на предположении независимости друг от друга отдельных наблюдений. Сущность метода наименьших квадратов основывается на том, что отыскиваются такие значения коэффициентов регрессии, при которых сумма квадратов отклонений фактических значений результативного признака от теоретических (вычисляется по функции выравнивания или уравнению связи) будет минимальной.

ух=a0+a1*x - функция связи

S=S(у-ух)2®min

S=S(у- a0-a1*x)2®min

¶S/¶a1=0

æna0+a1Sx=Sу,

èa0Sx+a1Sx2=Sxу

где n - число наблюдений , число пар Х и У

Решив эти уравнения, относительно а0 и а1, найдем параметры, подставив которые в уравнение связи построим прямую.

II. Kриволинейная корреляция

Если в качестве уравнения связи выбрана парабола второго порядка, то выравнивание производится по следующей функции:

ух=a0+a1*x+a2*x2

æna0+a1Sx+a2Sx2=Sу,

êa0Sx+a1Sx2+a2Sx3=Sxу

èa0Sx2+a1Sx3+a2Sx4=Sух2

Вычисляем результативное значение выравненного признака по функции связи. Строим эмпирическую линию регресии.

III. Если установлено наличие обратной связи, то уравнение связи может быть гипербола.

ух01

æna0+a1S1/x=Sу,

èa0S1/x+a1S1/x2=Sу/х

IV Обратной связью может быть и линейная лорреляция, при отрицательном значении а1.

V. Уравнение связи - степенная функция

ух0а1

lg ух=lg a0+a1lg x

æn lg a0+a1S lg x=S lg у,

èlg a0*S lg x+a1S lg x2=S lg x*lg у

Пример:

Рассмотрим пример определения функции связи между двумя признаками:

ОФ [x] Выпуск [y]   ху   х2   ух
2,4 14,4 2,692
4,0 32,0 3,537
3,6 32,4 3,958
4,0 40,0 4,38
4,5 45,0 4,38
4,6 50,6 4,802
5,6 67,2 5,224
6,5 84,5 5,646
7,0 98,0 6,068
5,0 75,0 6,49
  47,2 539,1 47,177

1. Определяем факторный и результативный признаки

2. Строим эмпирическую линию регрессии

3. Делаем предположение о возможной форме 0связи

ух=a0+a1*x, ух- выравненное значение у по х.

æna0+a1Sx=Sу,

èa0Sx+a1Sx2=Sxу

æ10а0+108а1=47,2

è108а0+1236а1=539,1

æа1=0,432

èа0=0,16

Уравнение связи принимает вид ух=0,16+0,432х

Наши рекомендации