Корреляционно-регрессионный анализ

6.1. Понятие и содержание корреляционного анализа

Взаимосвязь между величинами может быть полной (функциональной) и неполной (искажаемой другими факторами).

Основная задача корреляционного анализа –это установление характера и тесноты связи между результативными (зависимыми) и факторными (независимыми) показателями в данном явлении или процессе. Теснота связи определяется при помощи коэффициента корреляции, значение которого находится в интервале от -1 до +1. Если значение коэффициента лежит в интервале по модулю от 0,9 до 1 то отмечается очень сильная корреляционная зависимость. В интервале от 0,6 до 0,9 зависимость слабая, а в интервале от –0,6 до 0,6 зависимость очень слабая.

Пусть у нас есть данные о доходах – х и спросе на некоторый товар – у за ряд лет n. На основе анализа графического расположения точек делаем предположение о том, что между у и х существует линейная взаимосвязь. Чтобы построить уравнение регрессии нужно исследовать тесноту связи между этими случайными величинами, т.е. корреляционную зависимость.

При этом следует заметить, что количество элементов статистически значимой выборки можно определить по формуле: корреляционно-регрессионный анализ - student2.ru , где gmin-минимально допустимая величина выборки для исследования, m – число факторов модели, g – число свободных членов уравнения.

Для этого находят средние значения корреляционно-регрессионный анализ - student2.ru - для экзогенной переменной (функция СРЗНАЧ (Excel)) и корреляционно-регрессионный анализ - student2.ru - для эндогенной (6.1):

корреляционно-регрессионный анализ - student2.ru ; корреляционно-регрессионный анализ - student2.ru . (6.1)

где n – количество членов ряда значений x и y.

Затем находят отклонения от средних величин (6.2):

корреляционно-регрессионный анализ - student2.ru . (6.2)

На следующем этапе вычисляются дисперсии(функция ДИСП (Excel)) (6.3):

корреляционно-регрессионный анализ - student2.ru ; корреляционно-регрессионный анализ - student2.ru . (6.3)

После этого определяется средние квадратичные отклонения (функция СТАНДОТКЛОН (Excel)) (7.4):

корреляционно-регрессионный анализ - student2.ru ; корреляционно-регрессионный анализ - student2.ru . (6.4)

Величины дисперсии и среднеквадратического отклонения характеризуют разброс наблюдаемых значений вокруг среднего значения. Чем больше дисперсия, тем больше разброс.

Далее вычисляется корреляционный момент или коэффициент ковариации (6.5):

корреляционно-регрессионный анализ - student2.ru . (6.5)

Корреляционный момент отражает характер взаимосвязи между x и у. Если Kx,y > 0, то взаимосвязь прямая. Если Kx,y < 0, то взаимосвязь обратная.

На завершающем этапе корреляционного анализа определяется коэффициент корреляции (функция КОРЕЛЛ (Excel)) (6.6):

корреляционно-регрессионный анализ - student2.ru . (6.6)

Коэффициент корреляции возведенный в квадрат называется коэффициентом детерминации R2. Он показывает долю изменения результативного признака или эндогенной переменной – y под действием факторного признака или экзогенной переменной - x. Например, если для зависимости между объемом спроса и доходом R2 =0,2, то доходы населения определяют изменение спроса на 20%.

Далее следует регрессионный анализ.

Наши рекомендации