Изучение связи между ранжированными признаками
Изучатьсвязь между количественными признаками можно с помощью рангов.
Рангом неповторяющегося значения признака называется его порядковый номер в упорядоченной по неубыванию совокупности значений этого признака.
Рангом повторяющегося значения признака называется арифметическое среднее его порядковых номеров в упорядоченной по неубыванию совокупности значений этого признака.
Признак называется ранжированным, если каждому его значению приписан ранг.
Связь между двумя ранжированными признаками оценивается с помощью коэффициента Спирмена , вычисляемого по формуле
, (1.11.52)
где = - квадрат разности соответствующих рангов, n - число наблюдений.
Если соответствующие ранги совпадают, то =0 и . В этом случае связь – функциональная и прямая.
Если соответствующие ранги образуют обратные последовательности
и ,
то
и .
В этом случае связь – функциональная и обратная.
Таким образом, знак коэффициента Спирмена указывает на направление связи и чем ближе он по абсолютной величине к 1, тем связь сильнее.
Коэффициент Спирмена проверяют на значимость так же, как и линейный коэффициент корреляции.
Пример 1.11.6.Оценим связь между товарооборотом и издержками обращения (табл. 1.11.23) с помощью коэффициента Спирмена.
Диаграмма, построенная по данным табл. 1.11.23 (рис. 1.11.3), позволяет предположить наличие прямой связи между товарооборотом и издержками производства, несмотря на то, что в ряде случаев увеличение товарооборота ведет и к уменьшению издержек обращения, что объясняется влиянием на товарооборот других факторов.
Рис. 1.11.3. Товарооборот и издержки обращения (тыс. руб.)
Таблица 1.11.23
Товарооборот и издержки обращения, тыс. руб.
№ магазина | Товарооборот | Издержки обращения |
Ранжируем данные значения товарооборота y, издержек производства x и вычисляем коэффициент Спирмена, используя сумму в итоговой строке табл. 1.11.24.
Таблица 1.11.24
Расчетные показатели
Ранги | ||
7,5 | 0,25 | |
7,5 | 0,25 | |
22,5 |
.
Так как
> ,
то с вероятностью 0,95 можно утверждать, что связь между товарооборотом и издержками обращения – прямая и сильная.
Упражнение 1.11.6.По данным упражнения 1.11.1 оцените связь между признаками х и y с помощью коэффициента Спирмена.
В некоторых руководствах (например, [14]) рекомендуется вычислять коэффициент Спирмена по формуле (1.11.52) только в том случае, когда среди рангов результативного признака или фактора нет повторяющихся рангов, а в противном случае применять поправочные коэффициенты. Однако применение этих коэффициентов незначительно изменяет значение коэффициента Спирмена.
Связь между двумя ранжированными признаками, среди рангов которых нет повторяющихся, можно оценить с помощью коэффициента Кендалла , вычисляемого по формуле
, (1.11.53)
где числа Р и Q вычисляются по следующему правилу:
1) в первой строке таблицы записать ранги признака х в порядке возрастания;
2) во второй строке таблицы записать соответствующие ранги признака y;
3) для каждого ранга признака y, записанного во второй строке, подсчитать число рангов, записанных правее и больших этого ранга и найти сумму Р полученных чисел;
4) для каждого ранга признака y, записанного во второй строке, подсчитать число рангов, записанных правее и меньших этого ранга и найти сумму Q полученных чисел;
Коэффициент Кендалла изменяется в пределах от –1 до 1 и равен нулю при отсутствии связи между признаками. При большом числе наблюдений
Пример 1.11.7.Оценим с помощью коэффициента Кендалла связь между ранжированными признаками x и y:
,
,
.
Так как
> ,
то с вероятностью 0,95 можно утверждать, что связь между признаками - прямая и умеренная (табл. 1.11.1).
Упражнение 1.11.7.По данным упражнения 1.11.1 оцените связь между признаками х и y с помощью коэффициента Кендалла.