Анализ парных распределений (CROSSTABS)
Анализ парных распределений необходим прежде всего для установления зависимостей (связей) между переменными. Этот вид анализа позволяет сравнить между собой группы — структурные составляющие объекта исследования. Другими словами, исследователя интересуют вопросы:
♦ существует ли связь между переменными?
♦ насколько сильна эта связь?
♦ является ли она статистически значимой?
Как говорилось в предыдущей главе, связь существует, если значения, которые мы наблюдаем для независимой переменной, ассоциируются со значениями, наблюдаемыми для зависимой переменной. Например, если электоральная активность населения увеличивается в зависимости от возраста, то можно сделать вывод, что возраст, являющийся независимой переменной, ассоциируется с электоральной активностью и влияет на нее.
Чем сильнее связь, тем больше вероятность того, что она окажется статистически значимой. Кроме того, чем большее число случаев мы можем рассмотреть, тем более вероятно, что связь будет статистически значимой. Поэтому большие выборки с большей вероятностью дают статистически значимые результаты, нежели малые выборки2.
Для определения наличия связи, ее силы и значимости нужно построить кросстаб (разд. I, гл. 5).
2 Johnson J. and Joslyn R. Research Methods of Political Science. Washington, 1986. P. 280.
При выполнении анализа парных распределений и выявлений связей между переменными необходимо:
1. Выбрать в меню: Statistics -» Summarize-» Crosstabs(рис. 34).
Рис. 34
2. Вдиалоговом окне выбрать те переменные, которые нужно сопоставить.Например, исследователю необходимо выявить зависимость между степеньюудовлетворенности респондентов уровнем жизни (v4) и их отношением к идееприватизации в России (vl4).
Вопрос, соответствующий переменной v4: Насколько Вы удовлетворены Вашим уровнем жизни?
1 — удовлетворен.
2 — скорее удовлетворен, чем нет.
3 — скорее не удовлетворен.
4 — не удовлетворен.
5 — затрудняюсь ответить.
Вопрос, соответствующий переменной vl4: Что Вы думаете в целом об идее приватизации?
1— безусловно правильная идея.
2 — скорее правильная, чем неправильная идея.
3 — скорее неправильная, чем правильная идея.
4 — безусловно неправильная идея.
5 — затрудняюсь ответить.
Допустим, нам нужно, чтобы варианты ответа на вопрос № 4 располагались горизонтально (строки таблицы), а варианты ответа на вопрос № 14 — вертикально (столбцы таблицы). Для этого в диалоговом окне Crosstabsпеременная v4 помещается в ячейку Row(s),а переменная vl4 — в ячейку Column(s).
3. В нижней части диалогового окна Crosstabs находится опция Cells, которую нужно выбрать. Для анализа парных распределений нам будут необходимы проценты по строке и столбцу. Поэтому в списке процентов (Percentages) выбираем Row и Column (рис. 35).
Рис. 35
4. В опции Cells выбрать Continue.
5. В случае, если задачи исследования предполагают статистические расчеты с использованием коэффициентов (chi-square, lambda, gamma и т.д.), то в окне Crosstabs нужно выбрать опцию Statistics.
6. В окне Crosstabs выбрать Ок.
7. Результат анализа парных распределений выводится в окне Output —SPSS Viewer и представлен в табл. 24.
Количество строк (с первой по пятую) в таблице соответствует количеству вариантов ответа на вопрос № 4 об уровне жизни, а количество столбцов (с первого по пятый) — числу вариантов ответа на вопрос № 14 об идее приватизации.
В каждой ячейке таблицы зафиксированы три значения.
Таблица 2 V4* V14 Crosstabulation (таблица парных распределений)
v14 | Total | |||||||
v4 | Count | |||||||
% within v4 | 21,9% | 25,0% | 21,9% | 18,8% | 12,5% | 100,0% | ||
%within v14 | 11,7% | 6,7% | 4,7% | 2,8% | 6,5% | 5,3% | ||
Count | ||||||||
%within v4 | 19,7% | 29,5% | 14,8% | 26,2% | 9,8% | 100,0% | ||
% within v14 | 40,0% | 30,3% | 12,2% | 15,2% | 19,4% | 20,3% | ||
Count | ||||||||
% within v4 | 8,4% | 23,0% | 31,4% | 27,7% | 9,4% | 100,0% | ||
%within v14 | 26,7% | 37,0% | 40,5% | 25,1% | 29,0% | 31,8% | ||
Count | ||||||||
%within v4 | 5,2% | 11,7% | 25,4% | 47,2% | 10,5% | 100,0% | ||
% within v14' | 21,7% | 24,4% | 42,6% | 55,5% | 41,9% | 41,3% | ||
Count | ||||||||
% within v4 | 28,6% | 42,9% | 28,6% | 100,0% | ||||
% within v14 | 1,7% | 1,4% | 3,2% | 1,2% | ||||
Total | Count | |||||||
% within v4 | 10,0% | 19,8% | 24,7% | 35,2% | 10,3% | 100,0% | ||
% within v14 | 100,0% | 100,0% | 100,0% | 100,0% | 100,0% | 100,0% |
Первое — абсолютное числовое значение — количество респондентов, от метивших определенный вариант ответа на вопрос об уровне жизни и на воп рос об идее приватизации. Например, 13 респондентов, не удовлетворенны: своим уровнем жизни, считают идею приватизации безусловно правильной Поэтому в четвертой ячейке (первая колонка, четвертая строка) первая цифр, будет 13.
Второе значение — процент по строке (Row). В нашем примере второе значение в ячейке — 5,2% показывает, какой процент из тех, кто не удовлет ворен своим уровнем жизни, полагают, что идея приватизации является бе зусловно правильной идеей.
Третье значение — процент по столбцу (Column). 21,7% говорит о том какой процент составляют те, кто не удовлетворен своим уровнем жизни i группе сторонников приватизации (тех, кто считает приватизацию безуслов но правильной идеей).
Таким образом, из табл. 24 следует, что лишь небольшая часть (13 человек, или 5,2%) тех, кто не удовлетворен уровнем жизни, безусловно, поддерживает идею приватизации.
В последнем столбце (row, total)и последней строке (column, total)выводится суммарный результат. Первое значение является абсолютным суммарным значением по столбцу или по строке, а второе по столбцу и третье по строке — процентом этого значения к общему количеству опрошенных. Так, если общее количество неудовлетворенных своим уровнем жизни 248 человек (ячейка totalпо строке № 4), то это составляет 41,3% к общему количеству респондентов по базе данных (600 человек). Второе значение в этой ячейке равно 100%. Это суммарный процент по строке.
Аналогичные показатели приведены в ячейках последней строки таблицы . Разница состоит лишь в том, что за абсолютным значением сначала идет процент от общего количества, а затем суммарный процент по столбцу.