Распределение ответов для «нешкальных» типов
Вопросы Ответы | Вопрос 1 («стук в дверь») | Вопрос 2 («публичная дискуссия») | Вопрос 3 («опасение вызвать раздражение») | Число случаев |
Паттерн ответа: | — | — | + | |
— | + | — | ||
Всего 8 |
На практике принято считать приемлемым любое значение коэффициента воспроизводимости, которое превышает 0,90 (90%). Очевидно, что 100%-й воспроизводимостью может обладать лишь совершенная гутмановская шкала.
Если полученное значение коэффициента воспроизводимости превосходит заданный порог, данная совокупность вопросов может использоваться в качестве шкалы Гутмана. При этом вопросам присваиваются шкальные значения, отражающие их ранжирование по шкале (скажем, 1, 2 и 3), так что самый «легкий» вопрос получает самый низкий балл. Респонденты получают индивидуальный балл, соответствующий их шкальным типам (число положительных ответов либо суммарный балл).
Следует помнить о том, что полученная шкала отражает наличие определенной упорядоченности в той матрице реальных данных, для которых проверялась гутмановская модель. Иными словами, вывод о том, что данная совокупность вопросов составляет шкалу Гутмана, верен для данной выборки и для данной серии наблюдений. Перенос шкалы с одной популяции на другую требует новых данных и нового обоснования.
Мы рассмотрели лишь некоторые, относительно простые, методы конструирования индексов и шкал в социологии. Проанализированные нами примеры подтверждают полезность шкал для повышения качества социологического измерения (т. е. его надежности и валидности) и для экономного представления эмпирической информации, получаемой в ходе исследования. Наконец, анализ моделей измерения, лежащих в основании любой шкалы, часто помогает прояснить природу теоретических понятий и взаимосвязей между ними. Еще одним шагом к содержательным и основанным на реальных эмпирических наблюдениях выводам является анализ данных.
Основам анализа данных посвящена глава 8.
Дополнительная литература
Аванесов В. С. Тесты в социологическом исследовании. М.: Наука, 1982.
Грин Б. Ф. Измерение установки // Математические методы в современной буржуазной социологии. М.: Прогресс, 1966.
Девятко И. Ф. Диагностическая процедура в социологии: очерк истории и теории. М.: Наука, 1993.
Клигер С. А., Косолапов М. С., Толстова Ю. Н. Шкалирование при сборе и анализе социологической информации. М.: Наука, 1978.
Осипов Г. В., Андреев Э. П. Методы измерения в социологии. М.: Наука, 1977.
Толстова Ю. Н. Логика математического анализа социологических данных. М.: Наука, 1991.
Ядов В. А. Социологическое исследование: методология, программа, методы. 2-е изд. М.: Наука, 1987. Гл. 3.
[1] Используемая нами формула основана на некоторых важных предположениях: о том, что группы отбирались независимо и случайно; что дисперсии соответствующих генеральных совокупностей неравны; что параметры совокупностей распределены нормально. Существуют и иные, несколько отличные формулы для расчета t, которые применяются в тех случаях, когда сравниваемые подвыборки-группы невелики и получаемые для них данные каким-то образом «связаны», скоррелированы (например, если мы сравниваем групповые средние братьев и сестер или средние оценки одних и тех же школьников в первом классе и на выпускных экзаменах). Соответствующие формулы и пояснения можно найти в любом статистическом руководстве, а также в книгах, включенных в список дополнительной литературы по теме.
[2] Такие комбинации называют еще «обработками». Источник последнего термина — сельскохозяйственные опыты, для которых Р. Фишер разработал первые факторные планы, сочетавшие различные способы ухода за растениями, условия освещенности, типы почвы и режимы полива.
[3] Многочисленные примеры таких планов и описания соответствующих методов анализа результатов см. в: Дружинин Н. К. Выборочное наблюдение и эксперимент. М.: Статистика, 1977; Готтсданкер Р. Основы психологического эксперимента. М.: Изд-во МГУ, 1982; Вознесенский В. А. Статистические методы планирования эксперимента в технико-экономических исследованиях. 2-е изд., испр. и доп. М.: Финансы и статистика, 1981.Гл. 2,3.
[4] Miller W. L. The Survey Method in the Social and Political Science: Achievements, Failures, Prospects. L.: Frances Printer Publ., 1983. Part 1.
[5] Ibid. P. 6—7.
[6] Например, размерность матрицы «респонденты х переменные»может быть 2000 (респондентов х 32 (переменных), а размерность матрицы«городах переменные» — 6 (городов) х 4 (агрегированных показателей).
[7] См.: Hakim С. Research Design: Strategies and Choices in the Design of Social Research. L.: Alien & Unwin, 1987. P. 76—77.
[8] См.: Lazersfeld P. F., Berelson В., Gaudet H. The People's Choice: How the Voter Makes Up His Mind in a Presidential Campaign. N. Y: Columbia University Press, 1944.
[9] Hakim C. Op. Cit. P. 91¾92.
[10] Достаточно сказать, что проведение панели требует постоянного отслеживания адресов участников, поддержания контактов с ними. С этой целью используют и поздравительные открытки, и рассылку отчетов, и даже местные собрания респондентов.
[11] «Коронарный тип личности», т.е. особенно подверженный сердечно-сосудистым заболеваниям.
[12] См.: Hillery G. A. Communal Organizations. Chicago: ChicagoUniversity Press, 1955.
[13] Здесь и далее мы говорим о «причине» лишь в том смысле, что значение латентной переменной детерминирует. Определяет значения индикаторов (или наоборот).
[14] Среди справочных изданий общего характера следует в первую очередь указать на: Robinson J. P. et al. Measures of Political Attitudes. Ann Arbor: ISR, 1968; Shaw M. E., Wright J.M. Scales for the Measurement of Attitudes. N.Y.:McGray-Hill, 1967;MillerD. E. Handbook of Research Design and Social MeasurementN. Y.: Mckay, 1970.
[15] Более строгое и систематическое изложение этой темы см.: Стивенс С.С. Математика, измерение и психофизика //Экспериментальная психология: Пер. с англ. М.: Изд-во иност. лит., 1960. Т. 1. С. 19—89). См. также: Клигер С.А., Косолапов М.С., Толстова Ю.Н. Шкалирование при сборе и анализе социологической информации. М.: Наука, 1978. С. 7—39.
[16] Личностная тревожность в отличие от реактивной мало зависит от внешних травмирующих или угрожающих факторов и может рассматриваться как устойчивая индивидуальная черта.
[17] Открытым обычно называют вопрос, ответ на который респондент дает в свободной форме, закрытым — вопрос с жестко фиксированными альтернативами ответа. Открытые вопросы, в принципе, позволяют респонденту точнее выразить свое мнение, однако к их недостаткам можно отнести сложность кодирования, ограничения на сопоставимость данных и возможности анализа.
[18] Vaus D. A. de. Survey in Social Research. L.: Allen & Unwin, 1986. P. 71—74.
[19] Bradburn N. M., Sudman S. et al. Improving Interview Method and Questionnaire Design. San Francisco: Jossey-Bass Publ., 1979. Ch. 6. P. 85—106.
[20] См., в частности: Barton A. Asking the Embarassing Questions // Public Opinion Quarterly. 1958. Vol. 22. № 1. P. 67—68; Bradburn N. M., Sudman S. Op. cit.
[21] См.: Bradburn N. М., Sudman S. et al. Op. cit. P. 1—13, 175—184.
[22] Ibid. P. 179.
[23] Gallup G. H. The Quintamensional Plan of Question Design // Public OpinionQuart. 1947. Vol. 11. P. 385—393.
[24] Для более детального ознакомления с этим классом шкал см.: Шмелев А. Г. Введение в экспериментальную психосемантику. М.: Изд-во МГУ, 1983.
[25] Berscheid E., Snyder M., Omoto A. The Relationship Closeness Inventory: Assessing the Closeness of Interpersonal Relationships // Journal of Personality & Soc. Psychology. 1989. Vol. 57. P. 806.
[26] Подробнее об этом лучше прочитать дополнительно. См., например: Ноэль Э. Массовые опросы: Введение в методику демоскопии. М.: Прогресс, 1978. Гл. 1, 2; Babbie E. SurveyResearch Methods. 2nd ed. Belmont: Walworth Publ., 1990. Ch. 7.
[27] Мы говорим именно об оценке надежности, так как строго определенная надежность равнакоэффициенту детерминации измеренных значений истинными значениями переменной, т.е. квадрату коэффициента корреляции.
[28] Намного более подробное и снабженное соответствующими статистическими деталями описание методов оценки надежности можно найти в книге: Аванесов В. С. Тесты в социологическом исследовании. М.: Наука, 1982.
[29] Подробнее о многоиндикаторном подходе к оценке качества измерения см.: Девятко И.Ф. Диагностическая процедура в социологии: очерк истории и теории. М.: Наука, 1993.
[30] Валидность связана с надежностью так называемым основным психометрическим соотношением: валидность теста не превышает его надежности, т.е. надежность является необходимым условием валидности и задает верхний предел ее значения (ненадежный тест не может быть валиден, а валидный тест всегда надежен). Это легко понять интуитивно. Если стрелка ненадежного, испорченного спидометра вращается случайным образом, нет смысла обсуждать, насколько «чисто» он измеряет скорость.
[31] См., например: Mitchell A. The Nine American Life-Styles. N. Y.: Warner Books, 1983.
[32] Ghiselli E. E., Campbell J. P., Zedeck Sh. Measurement Theory for the Behavioral Sciences. San Francisco: W. H. Freeman and Co, 1981. P. 277—279.
[33] См.: Cronbach L. J., Meehl P. E. Construct Validity in Psychological Tests // Psychological Bulletin. 1955. Vol. 52. № 3. P. 281—302.
[34] Номинальная дихотомическая переменная, т.е. принимающая лишь два возможных значения, в данном случае ¾ «да» или «нет».
[35] См.: Аванесов В.С. Указ. соч. М.: Наука, 1982. С. 57¾60.
[36] Тех, кто хочет узнать больше о разных методах шкалирования и готов преодолеть трудности, связанные с использованием некоторых статистических понятий, мы можем отослать к обзорным работам, содержащим также необходимую библиографию: Грин Б. Ф. Измерение установки //Математические методы в современной буржуазной социологии. М.: Прогресс, 1966. С. 227¾228; Девятко И. Ф. Указ. соч.
[37] Thurstone L. L., Chave E. F. The Measurement of Attitudes. A Psychophysical Method and Some Experiments with a Scale for Measuring Attitude toward Church. 7th ed. Chicago: University of Chicago Press, [1929] 1964.
[38] Более полное представление о медиане как мере центральной тенденции и межквартильном размахе как мере разброса численных значений признака при необходимости можно получить из любого учебника по основам прикладной статистики. См., например: Гласc Дж., Стэнли Дж. Статистические методы в педагогике и психологии. М.: Прогресс, 1976. Гл. 4, 5. См. также гл. 8 настоящего издания.
[39] Фактические границы интервалов при построении гистограмм или полигонов распределения частот задают таким образом, чтобы численное значение выпадающей на данный интервал градации шкалы оказалось — с учетом принятого способа округления — в середине интервала (так, для градации 3 фактические границы могут составить 2,5 и 3,5). Более подробные сведения о правилах группирования значений переменной и графического представления полученного распределения частот можно найти в соответствующих разделах любого учебника по основам прикладной статистики.
[40] Дополнительные сведения о критике шкалы Терстоуна, а также о других методах отсева иррелевантных данных см., в частности: Клигер С. А., Косолапов М. С., Толстова Ю. Н. Шкалирование при сборе и анализе социологической информации. М.: Наука, 1978.Гл. 3; ,Девятко И. Ф. Указ. соч.
[41] Примеры шкал, разработанных Л. Гутманом и его сотрудниками, можно найти в классической работе: Stouffer S. A. Et al. Measurement and Prediction. N.Y.: John Wiley & Sons, [1950] 1966.
[42] В более строгой формулировке: логическая форма вопроса (суждения) должна предполагать, что вероятность принятия суждения является монотонно возрастающей (или убывающей) функцией шкальной позиции респондента.