Показатели взаимосвязи количественных переменных
Для ориентировочной оценки тесноты связи между двумя статистическими показателями используются следующие коэффициенты.
Коэффициент корреляции знаков Фехнера (i)
Определяется сопоставлением знаков отклонений x и y от их средних и подсчетом числа случаев совпадения и несовпадения знаков.
,
где u – число пар с одинаковыми знаками отклонений от средних, v – число пар с разными знаками отклонений от средних.
-1 < i < +1.
Если i близок к +1, то – тесная прямая связь.
Если i близок к -1, то – тесная обратная связь.
Если i близок к 0, то – связи нет.
Коэффициент корреляции рангов Спирмена (ρ)
,
где n – число рангов, Rx – ранг показателя x, Ry – ранг показателя y.
Если среди значений рангов по уровням встречаются одинаковые, то образуются одинаковые средние номера. Например, вместо одинаковых по порядку третьего и четвертого значений ряда будут два ранга по 3,5.
Если ρ близок к +1, то – тесная прямая связь.
Если ρ близок к -1, то – тесная обратная связь.
Если ρ близок к 0, то – связи нет.
Линейный коэффициент корреляции (rxy)
,
где σx и σy – среднее квадратическое отклонение x и y соответственно.
-1 < rxy < +1.
Если |rxy|≥0,7 – связь сильная,
если 0,5≥|rxy|<0,7 – связь средняя,
если |rxy|<0,5 – связь слабая.
При сильной и средней связи, если rxy >0, то связь прямая, иначе – обратная.
Пример 11.1. Зависимость между затратами производства (X, тыс. руб.) и прибылью (Y, тыс. руб.) 10 малых предприятий района за неделю характеризуется следующими данными.
n | X | Y |
90,53 | 93,21 | |
90,22 | 93,80 | |
99,41 | 100,32 | |
99,68 | 103,08 | |
95,11 | 97,12 | |
95,40 | 99,64 | |
94,24 | 95,88 | |
98,35 | 101,00 | |
96,34 | 97,42 | |
99,34 | 100,36 |
Определить тесноту связи между затратами производства и прибылью малых предприятий.
n | X | Y | X- | Y- | Совп | Rx | Ry | Rx-Ry | (Rx-Ry)2 | (X- )2 | (Y- )2 | ()() |
90,53 | 93,21 | -5,33 | -4,97 | + | 28,43 | 24,73 | 26,52 | |||||
90,22 | 93,8 | -5,64 | -4,38 | + | -1 | 31,83 | 19,21 | 24,73 | ||||
99,41 | 100,32 | 3,55 | 2,14 | + | 12,59 | 4,57 | 7,58 | |||||
99,68 | 103,08 | 3,82 | 4,90 | + | 14,58 | 23,98 | 18,70 | |||||
95,11 | 97,12 | -0,75 | -1,06 | + | 0,57 | 1,13 | 0,80 | |||||
95,4 | 99,64 | -0,46 | 1,46 | - | -1 | 0,21 | 2,12 | -0,67 | ||||
94,24 | 95,88 | -1,62 | -2,30 | + | 2,63 | 5,30 | 3,74 | |||||
98,35 | 2,49 | 2,82 | + | -2 | 6,19 | 7,94 | 7,01 | |||||
96,34 | 97,42 | 0,48 | -0,76 | - | 0,23 | 0,58 | -0,36 | |||||
99,34 | 100,36 | 3,48 | 2,18 | + | 12,10 | 4,74 | 7,57 | |||||
Итого | 958,62 | 981,83 | - | - | - | - | - | 109,35 | 94,30 | 95,60 |
, ,
u=8, v=2.
– связь средняя прямая.
– связь тесная прямая.
Следовательно, связь между затратами производства и прибылью малых предприятий района сильная и прямая.
Основные виды взаимосвязей между показателями. Показатели взаимосвязи качественных переменных
См 32 вопрос.
Определение параметров парной линейной регрессии
Наиболее простой случай корреляционной зависимости является парная корреляция – зависимость между двумя признаками (y и x). Уравнение такой связи называется парной линейной регрессией:
,
где y – зависимая переменная, x – факторный признак, α – свободный коэффициент уравнения, β – коэффициент регрессии: показывает, на сколько изменится среднее значение y ( ) при увеличении x на единицу.
Графическое представление парной линейной регрессии.
Парная регрессия легко определяется по графическому изображению реальных статистических данных в виде точек (корреляционное поле или диаграмма рассеивания).
Рис. 11.1. Графическое представление линии парной регрессии с МНК-параметрами
Метод наименьших квадратов.
Параметры α и β рассчитываются методом наименьших квадратов (МНК) по данным об n значениях признаков x и y. Исходное условие МНК для парной регрессии имеет вид:
То есть МНК позволяет получить такие оценки параметров a и b, при которых сумма квадратов отклонений фактических значений зависимой переменной y от расчетных (теоретических) минимальна.
Чтобы найти минимум этой функции необходимо вычислить производные по каждому из параметров α и β и приравнять их к нулю:
Þ
Если первое уравнение разделить на n, то получится:
Þ
Решая систему уравнений далее, находится коэффициент регрессии β:
где - среднее значение x, - среднее значение y, - среднее значение произведения xy, - дисперсия показателя x.
Пример 11.2. По данным примера 11.1. определить параметры и построить график уравнения парной линейной регрессии, определить тесноту связи с помощью парного коэффициента корреляции.
, ,
,
Тогда уравнение регрессии будет .
Рис. 11.2. Уравнение парной регрессии и фактические данные