Непараметрические методы оценки связи. В методах корреляционного и регрессионного анализа взаимосвязей используются основные характеристики (параметры) распределения – средние значения и дисперсии
В методах корреляционного и регрессионного анализа взаимосвязей используются основные характеристики (параметры) распределения – средние значения и дисперсии. Эти методы получили названиепараметрических.Статистической наукой разработаны и такие методы, с помощью которых можно измерить связь между явлениями, не используя количественные значения признака, а, значит, и параметры распределения. Такие методы получили названиенепараметрических.
При оценке взаимосвязи двух качественных признаков используют представление единиц совокупности в форме так называемых таблиц взаимной сопряженности.
Значения коэффициентов показывают наличие заметной связи между изучаемыми признаками. Коэффициент КЧупрова обычно дает более осторожную оценку связи.
Взаимосвязь между двумя альтернативными признаками измеряется с помощью 4-х клеточных таблиц.
В социально-экономических исследованиях нередко встречаются ситуации, когда признак не выражается количественно, однако единицы совокупности можно упорядочить, т.е.ранжировать.Примерами могут быть ранжирование студентов (учеников) по способностям, любой совокупности людей по уровню образования, профессии, по способности к творчеству и т.д. При ранжировании каждой единице совокупности присваиваетсяранг,т.е. порядковый номер. При совпадении значения признака у различных единиц им присваивается объединенный средний порядковый номер. Так, если 5-я и 6-я единица совокупности одинаковы, обе единицы получат ранг равный (5+6)/2=5,5. Для измерения связи между ранжированными признаками определяютранговые коэффициенты корреляции Спирмена (r) и Кендэлла (t).
Сущность метода Спирмена в следующем:
1) располагают варианты факторного признака по возрастанию, т.е. ранжируют единицы по значению признака X;
2) для каждой единицы совокупности указывают ранг с точки зрения результативного признака Y.
Если связь прямая, то с увеличением ранга признака Х, будет возрастать и рангY; при тесной прямой связи ранги признаковХиYв основном совпадут. При обратной связи возрастанию рангов признакаХбудет соответствовать общее убывание рангов признакаY. Теснота связи между признаками оценивается ранговым коэффициентом корреляции Спирмена:
где d – разность рангов признаков Х иY;n– число наблюдаемых единиц.
Кендэллом предложен другой показатель также с использованием рангов:
Расчет коэффициента Кендэлла выполняется в следующем порядке.
1. Ряд наблюдений располагается в возрастающем порядке по признаку Хс указанием соответствующих рангов по признакуY.
2. Упорядоченная таким образом последовательность берется как исходная для построения квадратной матрицы (aij) размерностью (n×n). Далее потребуются только элементы, расположенные выше главной диагонали. По каждой паре наблюдений (i,j) сравниваем ранги признакаY:
Сумма элементов aij, расположенных выше главной диагонали, и есть искомое значениеS в формуле коэффициента Кендэлла. При некотором навыке расчет величиныSможно выполнить, непосредственно сравнивая рангY данного наблюдения с рангамиYпоследующих наблюдений. Для каждого наблюдения подсчитываютсяР– число случаев, когда ранг признакаYследующих наблюдений меньше, чем у данного, иQ– число случаев, когда у следующих наблюдений ранг признакаYбольше, чем у данного. Искомое значение Правильность вычислений контролируется соблюдением условия .