Непараметрические методы оценки тесноты связи
Оценка тесноты связи с помощью дисперсионного и корреляционного анализа достаточно сложна и громоздка. Для измерения тесноты связи между исследуемыми признаками могут быть использованы менее точные, но более простые методы.
Методы дисперсионного и корреляционного анализа основаны на вычислении параметров распределения (средних величин, дисперсий) и поэтому их называют параметрическими методами оценки тесноты связи.
В свою очередь, методы измерения тесноты связи между признаками, которые не предусматривают использование количественных значений признаков (а следовательно, и параметров распределения), принято называть непараметрическими. К ним относят такие показатели, как:
- коэффициент корреляции знаков;
- коэффициент корреляции рангов;
- коэффициент ассоциации
- и другие.
Коэффициент корреляции знаков (коэффициент Фехнера) предполагает установление знаков отклонений каждого значения x от и каждого значения y от . Затем определяется число единиц изучаемой совокупности, у которых эти знаки совпадают – С, и число единиц, у которых они не совпадают – H. Коэффициент Фехнера определяется по формуле
. (10.24)
Очевидно, что С + Н = n (число единиц наблюдения).
В нашем примере (таблица 10.2, графы 10, 11):
С = 8
Н = 2
.
Коэффициент Фехнера меняется в диапазоне -1 < Кф < 1,
Кф = 0,6 означает, что связь прямая и достаточно тесная.
Коэффициент корреляции рангов. Известны два коэффициента: Спирмена и Кендэлла, но наиболее распространенным является коэффициент Спирмена. Он определяется по рангам. Ранг – это порядковый номер, присваиваемый каждому индивидуальному значению x и y в ранжированных рядах. Если несколько значений одинаковых, то их ранги определяются делением приходящейся на них суммы мест на число значений признака (таблица 10.2, графы 12, 13). После того, как определены по каждой единице совокупности ранги x и y, определяют их разность d (для каждой единицы) (таблица 10.2, графа 14). Коэффициент ранговой корреляции определяется по формуле
. (10.25)
В нашем примере:
.
Следовательно, связь прямая, тесная.
Основное преимущество коэффициента ранговой корреляции: он может быть использован там, где нет возможности измерить признак, но можно его проранжировать, например, оттенки цветов.
Коэффициент ассоциации применяется для оценки тесноты связи между альтернативными признаками. В этих случаях строится 4- клеточная таблица, в которой отражена связь между двумя альтернативными признаками.
Например, необходимо установить, имеется ли зависимость между семейным положением работников и обеспеченностью их жильем, если из 65 семейных обеспечены отдельными квартирами 55 человек, а из 40 одиноких квартиры имеют 25 человек.
Таблица 10.4 – Группировка работников по семейному положению и обеспеченности жильем
Обеспеченность жильём Семейное положение | Имеют отдельную квартиру | Не имеют отдельной квартиры |
Семейные | (a) 55 | (b) 10 |
Одинокие | (c) 25 | (d) 15 |
Каждая клетка этой таблицы имеет условное обозначение: a,b,c,d.
Коэффициент ассоциации определяют по формуле
. (10.26)
В нашем примере:
.
Следовательно: связь есть, связь прямая.
На практике известны случаи, когда один из квадратов такой таблицы может оказаться пустым (= 0), тогда Ка = 1. В этих случаях прибегают к исчислению коэффициента контингенции:
. (10.27)
В нашем примере:
.
На практике значение Кконт. всегда меньше значения Ка.
Некоторые авторы [18, с. 85] приводят только один коэффициент для оценки тесноты связи альтернативных признаков, называя его коэффициентом ассоциации:
. (10.28)