Статистический анализ таблицы сопряженности двух порядковых признаков
Если таблица основана на двух переменных, каждая из которых имеет порядковый уровень измерения, используется коэффициент корреляции гамма, который может принимать значения от –1 до +1.
¡= (3)
- сумма произведений внутриклеточных частот на сумму частот, расположенных ниже и правее данной клетки.
сумма произведений внутриклеточных частот на сумму частот, расположенных ниже и левее данной клетки;
Знак коэффициента указывает на направление — прямое или обратное — данной связи. Отрицательный знак говорит об обратной связи, положительный — о прямой. Так, например, если исследователю известно, что значимый коэффициент корреляции между возрастом и стажем политика составил +0,64, то это говорит о том, что с увеличением возраста стаж тоже растет. Если бы знак был отрицательный, то следовало бы сказать, что с увеличением возраста стаж уменьшается.
Таблица 4
Влияние оценки изменения материального положения семьи на отношение к товару N
Оценка изменения материального положения семьи за последний год | Отношение к товару N | |||
Положительное | Нейтральное | Отрицательное | ||
Улучшилось | ||||
59,3% | 28,0% | 12,7% | 100% | |
Осталось без изменений | ||||
37,4% | 42,3% | 20,3% | 100% | |
Ухудшилось | ||||
20,0% | 38,0% | 42,0% | 100% |
Рассмотрим данные, приведённые в таблице 4. Оценку изменения материального положения семьи будем считать независимой, а отношение к товару N —зависимой переменной. Обратим внимание на то, что порядок значений признаков, положенных в основу таблицы, должен быть одинаковым. В данном случае этот порядок—от большего к меньшему.
Нулевая гипотеза в нашем случае — предположение, что степень выраженности позитивного отношения к товару N не зависит от оценки изменения материального положения семьи.
Рассчитаем ¡ для нашей таблицы и определим его значимость.
=89(52+25+38+42)+42(25+42)+46(38+42)+52(42)=22651
=19(46+52+20+38)+25(20+38)+42(46+20)+52(20)=8226
¡=
Значимость данного коэффициента проверяется с помощью Z-критерия
Z=¡ =0,467 =0,467 =0,467×10,28 =4,8
Если расчётное значение Z-критерия превышает критическое, определяемое по таблицам нормального распределения, то связь является статистически значимой. Для доверительной вероятности 0,95 критическое значение данного критерия составляет 1,96.1 Так как 5,995 , коэффициент значим.
Убедившись в том, что коэффициент гамма значим и имеет знак “+” можно сделать следующий вывод из данных, приведенных в таблице.
Чем лучше оценка материального положения семьи по сравнению с прошлым годом, тем лучше отношение к товару N. Так, среди улучшивших материальное положение положительно относятся к данному товару 59,3%, в группе не изменивших материальное положение данный показатель снижается до 37,4%, а среди ухудшивших он составляет всего 20%.
Если бы коэффициент оказался отрицательным, следовало бы сделать следующий вывод: «Чем лучше оценка материального положения семьи по сравнению с прошлым годом, тем хуже отношение к товару N.»
1 Более математически обосновано независимая переменная определяется как признак, на основе значений которого могут быть предсказаны значения другого признака
1 Таблицы значений интеграла вероятностей нормального закона распределения см. Общая теория статистики. М.:Финансы и статистика, 1996. С.290.