Ранги – порядковые номера значений случайной величины в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же направлении (по возрастанию или убыванию)

Коэффициент ранговой корреляции Спирмена (Spearman rank correlation coefficient) — мера линейной связи между случайными величинами. Для оценки силы связи между величиными используются не численные значения, а соответствующие им ранги.

Этот коэффициент определяет степень тесноты и направленность связи признаков. Величина коэффициента лежит в интервале от +1 до -1. Абсолютное значение характеризует тесноту связи, а знак - направленность связи между двумя признаками.

Преимущество

Можно ранжировать по признакам, которые нельзя выразить численно: субъективные оценки, предпочтения и т.д. При экспертных оценках можно ранжировать оценки разных экспертов и найти их корреляции друг с другом, чтобы затем исключить из рассмотрения оценки эксперта, слабо коррелирующие с оценками других. Коэффициент корреляции рангов применяется для оценки устойчивости тенденции динамики.

Недостатки

Недостатком коэффициента корреляции рангов является то, что одинаковым разностям рангов могут соответствовать совершенно отличные разности значений (в случае количественных признаков). Недоучет размеров отклонений признаков от их средних величин занижает меру тесноты связи. Поэтому для количественных признаков корреляция рангов обладает меньшей информативностью, чем коэффициент корреляции числовых значений этих признаков.

Свойства

инвариантен (не изменен) по отношению к любому монотонному преобразованию шкалы измерения;

относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале;

при расчете не требуется никаких предположений о характере распределений признаков в генеральной совокупности.

Формула расчета коэффициента ранговой корреляции Спирмена

При ранжировании возможно появление одинаковых рангов в каждом ряду. Одинаковые ранги называются связками. Возможно присутствие нескольких связок в одном ряду рангов.

Повторяющиеся ранги для X и Y отсутствуют

- кол-во значений переменных в X и Y - должно быть одинаково

- разность рангов для пары значений X и Y

Повторяющиеся ранги для X и Y есть

В этом случае вводится поправка на связки в ранговых рядах. Поправка рассчитывается для каждого ряда отдельно. Поправка для каждого ряда рассчитывается с учетом всех связок в этом ряду.

- поправка для связок рангов в ряду X

- поправка для связок рангов в ряду Y

- номер связки в ряду X

- кол-во одинаковых рангов в связке с номером j

- номер связки в ряду Y

- кол-во одинаковых рангов в связке с номером k

16.Связь количественных признаков. Корреляционная таблица. Линейный коэффициент корреляции. Уравнение регрессии.

Допустим, что существует стохастическая зависимость случайной переменной Y от Х. Зафиксируем некоторое значение х переменной Х. При Х=хпеременная Y в силу ее стохастической зависимости от Х может принять любое значение из некоторого множества, причем какое именно – заранее не известно. Поэтому, прежде всего, стараются выяснить, изменяются или нет при изменении х условные математические ожидания М(Y/Х=х). Если при изменении х условные математические ожидания М(Y/Х=х) изменяются, то говорят, что имеет место корреляционная зависимость величины Y от Х.
Функция φ(х)=М(Y/Х=х), описывающая изменение условного математического ожидания случайной переменной Y при изменении значений хпеременной Х, называется функцией регрессии, а ее график – линией регрессии.
Для отыскания функции регрессии, вообще говоря, необходимо знать закон распределения случайной двумерной величины (Х,Y). В нашем распоряжении лишь выборка ограниченного объема. Поэтому в этом случае речь может идти об оценке (приближенном выражении) функции.
В качестве оценок условных математических ожиданий принимают условные средние, которые находят по данным наблюдений (по выборке).
Условным средним`ухназывают среднее арифметическое наблюдавшихся значений Y, соответствующих Х=х.
Условное математическое ожидание М(Y/х) является функцией от х, следовательно, его оценка, т.е. условное среднее `ух, также функция от х; обозначив эту функцию через φ*(х), получим уравнение
х = φ*(х).
Это уравнение называют выборочным уравнением регрессии; функцию φ*(х) называют выборочной регрессией, а ее график – выборочной линией регрессии.
Как найти по данным наблюдений параметры функции φ*(х), если вид ее известен? Как оценить силу (тесноту) связи между величинами Х и Y и установить, коррелированы ли эти величины? Ответы на эти вопросы изложены ниже.

Ранги – порядковые номера значений случайной величины в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же направлении (по возрастанию или убыванию) - student2.ru Ранги – порядковые номера значений случайной величины в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же направлении (по возрастанию или убыванию) - student2.ru

Ранги – порядковые номера значений случайной величины в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же направлении (по возрастанию или убыванию) - student2.ru

Ранги – порядковые номера значений случайной величины в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же направлении (по возрастанию или убыванию) - student2.ru

Наши рекомендации