Коэффициенты взаимной сопряженности К. Пирсона
И коэффициент взаимной сопряженности А. А. Чупрова
Коэффициенты взаимной сопряженности Пирсона и Чуп-
Рова используются в том случае, если по каждому из взаимо-
Связанных признаков выделяется число групп более двух. Факт
наличия связи устанавливается с помощью критерия χ2.
, (10.51)
где μij — фактическая (эмпирическая) клеточная частота, т. е.
число единиц с i-м значением признака x и j-м значением при-
знака y;
— теоретическая клеточная частота, которая отвечает
предположению о независимости признаков x и y, т. е. отсутс-
Твию связи.
Теоретическую клеточную частоту находят по формуле
, (10.52)
Т. е. итог по строке надо умножить на итог по столбцу и разде-
Лить на общее число данных.
Сумма теоретических частот всех клеток таблицы равна
общему числу наблюдений n. Сумма теоретических частот по
строкам и столбцам соответственно равна μi и μj. Поэтому, те-
Оретические частоты — это перераспределение исходных дан-
Ных в том предположении, что связь между изучаемыми при-
знаками x и y отсутствует. Значение χ2 показывает, насколько
Велико расхождение реальных частот с теми, которые были бы
в том случае, если изучаемые признаки x и y не зависели бы
Друг от друга. Данное расхождение будет всегда, поэтому есть
таблица критических значений критерия χ2 (мы ей уже поль-
Зовались, когда проверяли гипотезу о нормальном распределе-
Нии и значимость коэффициента конкордации). Распределение
χ2 зависит от уровня значимости б, которое назначается иссле-
Дователем и от числа степеней свободы
v = (k1 − 1)(k2 − 1),
где k1 — число категорий признака x (число строк таблицы);
k2 — число категорий признака y (число столбцов таб-
Лицы).
Найденное по формуле (10.51) значение χ2 сравнивается с
Табличным при принятом уровне значимости и данном числе
степеней свободы. Если χ2 > , то делается вывод о наличии
связи между признаками x и y. В том случае, если χ2 ≤ , гипо-
теза о независимости x и y не отклоняется, т. е. наличие связи
между признаками x и y не может считаться доказанным.
Используем данные примера 10.3 и сделаем вывод о нали-
Чии или отсутствии зависимости успеваемости студентов-ве-
Черников от соответствия профиля работы.
Для этого используем критерий χ2. Сначала найдем теоре-
тические клеточные частоты:
;
;
;
.
Теперь по формуле (10.51) находим:
Количество степеней свободы в данном случае будет равно:
v = (2 − 1)(2 − 1) = 1, так как k1 = k2 = 2.
Принимаем 5%-ный уровень значимости (α = 0,05) и по
таблице критерия χ2 (приложение 6) находим: = 3,84. Так
как χ2 > , то делаем вывод, что распределение неслучайно и
Скорее всего связанно с зависимостью между признаками, ко-
Торые положены в основу группировки. Следовательно, можно
Говорить о зависимости между характером работы студентов
Вечерников и результатами сдачи ими экзаменов по специаль-
Ным предметам.
Для измерения тесноты имеющейся связи между изуча-
Емыми признаками используют коэффициенты взаимной со-
Пряженности Пирсона и Чупрова. Коэффициент взаимной со-
Пряженности К. Пирсона находится по формуле
, (10.53)
Где .
Данный коэффициент не принимает во внимание число ка-
тегорий для изучаемых признаков x и y.
Более совершенным и точным является коэффициент вза-
Имной сопряженности А. А. Чупрова, который вычисляется по
следующей формуле:
. (10.54)
Оба приведенных нами коэффициента взаимной сопря-
женности основаны на нормировании χ2: погашении зависи-
Мости от числа наблюдений и размерности таблицы. Данные
коэффициенты принимают все свои значения на отрезке [0, 1],
причем КЧвз, если таблица не квадратная, никогда не достигает
Единицы.
Приведем конкретный пример вычисления коэффициен-
Тов взаимной сопряженности Пирсона и Чупрова.
Пример 10.4
Пусть известно распределение 500 участков, засеянных
сахарной свеклой, по двум признакам: степени полива (х) и
уровню урожайности (y) (табл. 10.11).
Необходимо определить, случайно ли данное распределе-
ние (см. табл. 10.11) и существует ли зависимость между x и y.