Сущность корреляционно-регрессионного анализа

Одним из методов выявления взаимосвязей является корреляционно-регрессионный анализ.

Корреляционно–регрессионный анализ включает решение задач двух видов:

- задача корреляционного анализа сводится к измерению тесноты связи между варьирующими признаками;

- задача регрессионного анализа состотт в установлении формы зависимости, определении уравнения регрессии.

Рассмотрим применение приемов корреляционного анализа на конкретном примере (табл. 1).

Таблица 1

Товарооборот и издержки обращения десяти предприятий, млн р.

Товарооборот
Издержки обращения 0,8 1,0 0,2 0,4 0,3 0,7 0,6 0,9 0,6 0,9

При рассмотрении вопросов подбора формы связи особое внимание уделяется глубокому теоретическому анализу изучаемого процесса, установлению причинно–следственных связей. Наиболее распространенным приемом выявления формы связи являются графические изображения.

Графический анализ исходных данных (рис. 1) показывает, что с увеличением товарооборота растут и издержки обращения.

Сущность корреляционно-регрессионного анализа - student2.ru

Рис. 1. Зависимость издержек обращения от товарооборота

После того как будет установлено, что зависимость между признаками есть, нужно установить теоретическую форму связи, т. е. вид математической функции Сущность корреляционно-регрессионного анализа - student2.ru , которая наилучшим образом описывает поведение изучаемого признака.

Допустим, что между рассматриваемыми показателями существует линейная связь.

Уравнение линейной связи в общем виде можно записать так:

Сущность корреляционно-регрессионного анализа - student2.ru .

Это уравнение, выражающее зависимость y от x, называется уравнением регрессии.

Найти уравнение регрессии означает определить параметры а1 и а0. Их оценивают при помощи метода наименьших квадратов, который дает следующую систему нормальных уравнений:

Сущность корреляционно-регрессионного анализа - student2.ru

где х – значения факторного признака, в нашем примере суммы товарооборота (табл. 1, строка 1);

у – значения результативного признака – суммы издержек обращения (табл. 1, строка 2);

n – число парных значений факторного и результативного при–
знаков.

Для составления и решения системы линейных уравнений, т. е. определения параметров, воспользуемся данными табл. 2, в которой рассчитаем необходимые компоненты åх, åу, åх2, åху, исходные данные предварительно ранжируем (располагаем по возрастанию значений факторного признака – товарооборота) и заносим в таблицу 2.

Таблица 2

Расчетная таблица параметров уравнения регрессии

Номер предприятия Товарооборот, млн р. (х) Издержки обращения, млн р. (у) х2 ху Сущность корреляционно-регрессионного анализа - student2.ru у2
А
0,2 1,0 0,28 0,04
А
0,4 2,4 0,31 0,16
0,3 2,4 0,37 0,09
0,6 7,8 0,52 0,36
0,7 11,9 0,65 0,49
0,6 11,4 0,71 0,36
0,8 16,0 0,74 0,64
0,9 22,5 0,90 0,81
0,9 23,4 0,93 0,81
1,0 28,0 0,99 1,00
Итого 6,4 126,8 6,40 4,76

В гр. 3 таблицы 2 вносим квадраты переменных х2 (52, 62, 82 и т.д.), в гр.4 – произведение х на у (5´0,2; 6´0,4; и т.д.).

Итоговые показатели граф (1–4) подставляем в систему нормальных уравнений:

Сущность корреляционно-регрессионного анализа - student2.ru Сущность корреляционно-регрессионного анализа - student2.ru

Сущность корреляционно-регрессионного анализа - student2.ru Чтобы уравнять коэффициент при Сущность корреляционно-регрессионного анализа - student2.ru каждый член первого уравнения умножаем на 167, второго – на 10 и из второго вычитаем первое:

Сущность корреляционно-регрессионного анализа - student2.ru

Параметр а1 = Сущность корреляционно-регрессионного анализа - student2.ru . Подставим его значение в первое уравнение и найдем параметр аo:

10ао+ 0,031´167 = 6,4,

10ао+ 5,177 = 6,4,

ао = Сущность корреляционно-регрессионного анализа - student2.ru .

Уравнение регрессии примет вид: Сущность корреляционно-регрессионного анализа - student2.ru = 0,12 + 0,031х. Подставляя в него значения х, найдем выравненные, или теоретические значения, Сущность корреляционно-регрессионного анализа - student2.ru . Так, при товарообороте 5 млн р. (х1) теоретическое значение суммы издержек составит: Сущность корреляционно-регрессионного анализа - student2.ru = 0,12 + 0,031´5 = 0,28. При товарообороте 6 млн. р. Сущность корреляционно-регрессионного анализа - student2.ru = 0,12 + 0,031 ´6 = 0,31 и т.д.

Теоретические значения помещены в гр. 5 таблицы 2. Сумма выравненных значений должна быть равна сумме фактических значений результативного признака ( Сущность корреляционно-регрессионного анализа - student2.ru ); 6,4 = 6,4. Если такого равенства нет, то следует проверить правильность всех предшествующих расчетов.

Экономический смысл имеет параметр а1, который называется коэффициентом регрессии. Коэффициент регрессии показывает, на сколько единиц в среднем изменится у при увеличении х на единицу. В рассмотренном примере увеличение товарооборота на 1 млн р. ведет в среднем к росту издержек обращения на 0,031 млн р.

В случае установления линейной зависимости между факторным (x) и результативным (y) признаками для оценки тесноты связи между ними рассчитывают линейный коэффициент корреляции:

Сущность корреляционно-регрессионного анализа - student2.ru .

Линейный коэффициент корреляции может принимать любые значения от –1 до +1. Чем ближе значение этого коэффициента к Сущность корреляционно-регрессионного анализа - student2.ru 1, тем более тесная связь предполагается между признаками х и у. Если rху = 0, то это не всегда говорит об отсутствии связи вообще – часто это означает отсутствие линейной связи. В таком случае нужно использовать нелинейные зависимости (уравнение гиперболы, уравнение логарифмической кривой, экспоненциальную зависимость и др.).

Для качественной оценки тесноты связи между признаками используется шкала Чэддока (табл. 3).

Таблица 3

Оценка тесноты связи по шкале Чэддока

Показатели тесноты связи 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
Характеристика тесноты связи Слабая Умеренная Заметная Высокая Очень высокая

Знак при линейном коэффициенте корреляции указывает направление связи: «+» – прямая связь; «–» – обратная связь.

Рассчитаем линейный коэффициент корреляции для рассмотренного примера, для этого воспользуемся данными итоговой строки таблицы 2:

Сущность корреляционно-регрессионного анализа - student2.ru

Согласно таблице Чэддока, при r = 0,97 зависимость результативного признака от факторного очень высокая. Следовательно, найденное уравнение регрессии Сущность корреляционно-регрессионного анализа - student2.ru = 0,12 + 0,031х можно использовать для прогноза суммы издержек при наличии данных об изменении суммы товарооборота.

Наши рекомендации