Схематическое изображение четырехклеточного фрагмента таблицы 17
Читает УГ | Не читает УГ | |
Учитель | Исходная частота | Сумма респондентов-учителей, читающих газеты, отличные от УГ |
Не учитель | Сумма респондентов, являющихся не учителями и читающих УГ | Сумма респондентов, являющихся не учителями и читающих газеты, отличные от УГ |
Учитывая это, а также вспоминая, что понятие маргинальной суммы имеет смысл не только для исходной таблицы, но и для всех ее подтаблиц, сформулируем правила получения интересующих нас ее компонентных четырехклеточных фрагментов (эти правила мы заимствуем у И. И. Елисеевой [Интерпретация и анализ …., 1987, с.43-44]).
1. Каждая из частот исходной таблицы должна встречаться только в одной из компонентных таблиц.
2. Маргинальные частоты исходной таблицы должны встречаться в одной из компонентных таблиц как частоты определенного типа: либо как "клеточные" (т.е. стоящие в клетке частотной таблицы), либо как маргинальные.
3. Каждая частота, содержащаяся в одной из компонентных таблиц, но отсутствующая в исходной таблице (а такие могут встретиться в тех специфических подтаблицах, о которых мы говорили выше) должна появится в другой компонентной таблице как частота другого типа: "клеточная", если была маргинальной, и наоборот.
Отметим, что сформулированные правила не определяют разложение однозначным образом. То, какое из возможных разложений мы выберем для интерпретации, определяется содержательными соображениями. Возможна и такая ситуации, когда мы усмотрим нечто содержательно полезное в нескольких разложениях. Перейдем к примеру. Воспользуемся цитированной выше работой.
Итак, следуя И. И. Елисеевой, рассмотрим задачу изучения по данным обследования семейных групп (семья сына или дочери - семья родителей) зависимости характера желаемого расселения (отделения "молодой" семьи от семьи родителей) от состава "молодой" семьи и возраста женщины в этой семье. Исходная частотная таблица имеет следующий вид:
Таблица 20.
Таблица сопряженности, используемая для разложения ее на четырехклеточные подтаблицы
Характеристика "молодой" семьи | Желаемое расселение | Итого | |||
Возраст женщины (лет) | состав | в одной квартире | в разных квартирах | в одном микр-не и дальше | |
До 30 | Мать с детьми | ||||
Брачная пара с детьми | |||||
30-40 | Мать с детьми | ||||
Брачная пара с детьми | |||||
40-55 | Мать с детьми | ||||
Брачная пара с детьми | |||||
Итого |
Отметим, что здесь два признака, характеризующие "молодую" семью (ее состав и возраст женщины) фактически превращены в один новый признак, значениями которого служат сочетания значений первоначальных признаков. Именно это позволило таблицу, фактически являющуюся трехмерной, превратить в двумерную. Нетрудно проверить, что на основе вычисления для этой статистики величины на 5-процентном уровне значимости можно сделать вывод о том, что у нас имеются все основания отвергнуть нуль-гипотезу об отсутствии статистической связи между нашими двумя признаками: =39,2, в то время, как = 18,3 (a=0,05; df=10). Встает вопрос: все ли значения рассматриваемых признаков играют одинаковую роль в процессе возникновения этой связи (точнее, в том, что эмпирические частоты оказались отличными от теоретических)? Может ли быть так, что между какими-то наборами альтернатив связь существует, а между какими-то – нет? Чтобы понять это, воспользуемся одним из возможных разложений нашей исходной таблицы на четырехклеточные (в цитируемой нами работе представлено три варианта такого разложения; каждое из них позволяет сделать свои содержательные выводы; мы воспользуемся только тем разложением, которое в названной работе приведено первым).
Для того, чтобы было ясно, как строится разложение (как выделяются четырехклеточные подтаблицы) приведем примеры нескольких таких подтаблиц.