Корреляционно-регрессионный анализ
6.1. Понятие и содержание корреляционного анализа
Взаимосвязь между величинами может быть полной (функциональной) и неполной (искажаемой другими факторами).
Основная задача корреляционного анализа –это установление характера и тесноты связи между результативными (зависимыми) и факторными (независимыми) показателями в данном явлении или процессе. Теснота связи определяется при помощи коэффициента корреляции, значение которого находится в интервале от -1 до +1. Если значение коэффициента лежит в интервале по модулю от 0,9 до 1 то отмечается очень сильная корреляционная зависимость. В интервале от 0,6 до 0,9 зависимость слабая, а в интервале от –0,6 до 0,6 зависимость очень слабая.
Пусть у нас есть данные о доходах – х и спросе на некоторый товар – у за ряд лет n. На основе анализа графического расположения точек делаем предположение о том, что между у и х существует линейная взаимосвязь. Чтобы построить уравнение регрессии нужно исследовать тесноту связи между этими случайными величинами, т.е. корреляционную зависимость.
При этом следует заметить, что количество элементов статистически значимой выборки можно определить по формуле: , где gmin-минимально допустимая величина выборки для исследования, m – число факторов модели, g – число свободных членов уравнения.
Для этого находят средние значения - для экзогенной переменной (функция СРЗНАЧ (Excel)) и - для эндогенной (6.1):
; . (6.1)
где n – количество членов ряда значений x и y.
Затем находят отклонения от средних величин (6.2):
. (6.2)
На следующем этапе вычисляются дисперсии(функция ДИСП (Excel)) (6.3):
; . (6.3)
После этого определяется средние квадратичные отклонения (функция СТАНДОТКЛОН (Excel)) (7.4):
; . (6.4)
Величины дисперсии и среднеквадратического отклонения характеризуют разброс наблюдаемых значений вокруг среднего значения. Чем больше дисперсия, тем больше разброс.
Далее вычисляется корреляционный момент или коэффициент ковариации (6.5):
. (6.5)
Корреляционный момент отражает характер взаимосвязи между x и у. Если Kx,y > 0, то взаимосвязь прямая. Если Kx,y < 0, то взаимосвязь обратная.
На завершающем этапе корреляционного анализа определяется коэффициент корреляции (функция КОРЕЛЛ (Excel)) (6.6):
. (6.6)
Коэффициент корреляции возведенный в квадрат называется коэффициентом детерминации R2. Он показывает долю изменения результативного признака или эндогенной переменной – y под действием факторного признака или экзогенной переменной - x. Например, если для зависимости между объемом спроса и доходом R2 =0,2, то доходы населения определяют изменение спроса на 20%.
Далее следует регрессионный анализ.