Статистическое исследование зависимости между качественными признаками
Для исследования зависимости между качественными признаками могут быть использованы методы группировки, методы дисперсионного анализа, коэффициенты ранговой корреляции и специфические показатели степени тесноты связи между качественными признаками (коэффициент ассоциации, коэффициент контингенции и др.). При этом следует иметь в виду, что коэффициент ассоциации и коэффициент контингенции применимы для оценки степени тесноты связи только между альтернативными признаками. Здесь полезно вспомнить, что именно такие качественные признаки характерны экономическим явлениям и процессам.
Коэффициент ассоциации вычисляется по следующей формуле
.
Параметры a, b, c, d определяются построением так называемой таблицы «четырех полей».
Рассмотрим пример. Необходимо выявить существует ли связь между выполнением норм выработки рабочими предприятия и техническим уровнем их обучения. Исходные данные:
Группа рабочих | Число рабочих мест, чел | ||
выполняющих и перевыполняющих норму | не выполняющие норму | Всего | |
1. Прошедшие техническое обучение | |||
2. Не прошедшие техническое обучение | |||
Итого |
Представим эту таблицу в форме «таблицы четырех полей»
a | b | a+b |
c | d | c+d |
a+c | b+d |
Для нашего примера имеем .
Можно говорить о наличии весьма тесной прямой связи между данными качественными признаками.
Если , то коэффициент ассоциации равен нулю. Практически считается, что величина свидетельствует о наличии связи между изучаемыми качественными признаками.
Недостатком является то, что если хотя бы один из четырех показателей «таблицы четырех полей» равен нулю (т.е. отсутствует), то , что дает преувеличенное представление о степени тесноты связи между изучаемыми качественными признаками.
Коэффициент контингенции дает более точную оценку степени тесноты связи и вычисляется также на основании данных «таблицы четырех полей» по формуле
.
По вышеприведенным данным величина составляет
.
Следует иметь в виду, что всегда меньше .
Практически наличие связи между изучаемыми альтернативными признаками считается подтвержденным при величине не ниже 0,3.
Для использования коэффициентов корреляции рангов необходимо признаки, хотя и качественные, упорядочить, например, по балловым (бальным) оценкам. Как пример такого подхода можно вспомнить уровень квалификации работников.
Для оценки степени тесноты связи между несколькими качественными признаками при использовании рангов применяется коэффициент конкордации , вычисляемый по формуле
,
где m – число факторов (признаков);
n – число ранжируемых единиц;
S – сумма квадратов степеней рангов.
Если обозначить ранг i-го фактора у j-й единицы, то величина S будет равна
.
Рассмотрим вычисление коэффициента конкордации на учебном примере.
Пример. По приведенным в таблице данным оценить множественную связь
Порядковый номер предприятия | Ранг по показателю | ||||
Уровня рентабельности | Уровня качества | Уровня спроса | |||
Окончание табл.
Итого | - | - | - |
Из таблицы можно определить сумму квадратов отклонений рангов
.
Величина составляет
.
Это свидетельствует о наличии достаточно тесной зависимости между изучаемыми признаками.