Изучение связи между ранжированными признаками

Изучатьсвязь между количественными признаками можно с помощью рангов.

Рангом неповторяющегося значения признака называется его порядковый номер в упорядоченной по неубыванию совокупности значений этого признака.

Рангом повторяющегося значения признака называется арифметическое среднее его порядковых номеров в упорядоченной по неубыванию совокупности значений этого признака.

Признак называется ранжированным, если каждому его значению приписан ранг.

Связь между двумя ранжированными признаками оценивается с помощью коэффициента Спирмена Изучение связи между ранжированными признаками - student2.ru , вычисляемого по формуле

Изучение связи между ранжированными признаками - student2.ru , (1.11.52)

где Изучение связи между ранжированными признаками - student2.ru = Изучение связи между ранжированными признаками - student2.ru - квадрат разности соответствующих рангов, n - число наблюдений.

Если соответствующие ранги совпадают, то Изучение связи между ранжированными признаками - student2.ru =0 и Изучение связи между ранжированными признаками - student2.ru . В этом случае связь – функциональная и прямая.

Если соответствующие ранги образуют обратные последовательности

Изучение связи между ранжированными признаками - student2.ru и Изучение связи между ранжированными признаками - student2.ru ,

то

Изучение связи между ранжированными признаками - student2.ru и Изучение связи между ранжированными признаками - student2.ru .

В этом случае связь – функциональная и обратная.

Таким образом, знак коэффициента Спирмена указывает на направление связи и чем ближе он по абсолютной величине к 1, тем связь сильнее.

Коэффициент Спирмена проверяют на значимость так же, как и линейный коэффициент корреляции.

Пример 1.11.6.Оценим связь между товарооборотом и издержками обращения (табл. 1.11.23) с помощью коэффициента Спирмена.

Диаграмма, построенная по данным табл. 1.11.23 (рис. 1.11.3), позволяет предположить наличие прямой связи между товарооборотом и издержками производства, несмотря на то, что в ряде случаев увеличение товарооборота ведет и к уменьшению издержек обращения, что объясняется влиянием на товарооборот других факторов.

Изучение связи между ранжированными признаками - student2.ru

Рис. 1.11.3. Товарооборот и издержки обращения (тыс. руб.)

Таблица 1.11.23

Товарооборот и издержки обращения, тыс. руб.

№ магазина Товарооборот Издержки обращения

Ранжируем данные значения товарооборота y, издержек производства x и вычисляем коэффициент Спирмена, используя сумму в итоговой строке табл. 1.11.24.

Таблица 1.11.24

Расчетные показатели

Ранги  
Изучение связи между ранжированными признаками - student2.ru Изучение связи между ранжированными признаками - student2.ru Изучение связи между ранжированными признаками - student2.ru
7,5 0,25
7,5 0,25
Изучение связи между ранжированными признаками - student2.ru   22,5

Изучение связи между ранжированными признаками - student2.ru .

Так как

Изучение связи между ранжированными признаками - student2.ru > Изучение связи между ранжированными признаками - student2.ru ,

то с вероятностью 0,95 можно утверждать, что связь между товарооборотом и издержками обращения – прямая и сильная.

Упражнение 1.11.6.По данным упражнения 1.11.1 оцените связь между признаками х и y с помощью коэффициента Спирмена.

В некоторых руководствах (например, [14]) рекомендуется вычислять коэффициент Спирмена по формуле (1.11.52) только в том случае, когда среди рангов результативного признака или фактора нет повторяющихся рангов, а в противном случае применять поправочные коэффициенты. Однако применение этих коэффициентов незначительно изменяет значение коэффициента Спирмена.

Связь между двумя ранжированными признаками, среди рангов которых нет повторяющихся, можно оценить с помощью коэффициента Кендалла Изучение связи между ранжированными признаками - student2.ru , вычисляемого по формуле

Изучение связи между ранжированными признаками - student2.ru , (1.11.53)

где числа Р и Q вычисляются по следующему правилу:

1) в первой строке таблицы записать ранги признака х в порядке возрастания;

2) во второй строке таблицы записать соответствующие ранги признака y;

3) для каждого ранга признака y, записанного во второй строке, подсчитать число рангов, записанных правее и больших этого ранга и найти сумму Р полученных чисел;

4) для каждого ранга признака y, записанного во второй строке, подсчитать число рангов, записанных правее и меньших этого ранга и найти сумму Q полученных чисел;

Коэффициент Кендалла изменяется в пределах от –1 до 1 и равен нулю при отсутствии связи между признаками. При большом числе наблюдений Изучение связи между ранжированными признаками - student2.ru

Пример 1.11.7.Оценим с помощью коэффициента Кендалла связь между ранжированными признаками x и y:

Изучение связи между ранжированными признаками - student2.ru
Изучение связи между ранжированными признаками - student2.ru

Изучение связи между ранжированными признаками - student2.ru ,

Изучение связи между ранжированными признаками - student2.ru ,

Изучение связи между ранжированными признаками - student2.ru .

Так как

Изучение связи между ранжированными признаками - student2.ru > Изучение связи между ранжированными признаками - student2.ru ,

то с вероятностью 0,95 можно утверждать, что связь между признаками - прямая и умеренная (табл. 1.11.1).

Упражнение 1.11.7.По данным упражнения 1.11.1 оцените связь между признаками х и y с помощью коэффициента Кендалла.

Наши рекомендации