Приемы измерения социальной установки
ПРИЕМЫ ИЗМЕРЕНИЯ СОЦИАЛЬНОЙ УСТАНОВКИ
Шкала Луи Терстоуна. Шкала Эмори Богардуса. Шкалограммный анализ Луи Гуттмана. Сходство и различие шкал Лайкерта и Терстоуна. Сходство и различие шкал Богардуса и Гуттмана.
Мы продолжаем рассматривать приемы одномерного шкалирования. Вы уже убедились в том, как трудно на практике придумать логический квадрат, шкалу суммарных оценок. У многих наверняка получились не очень хорошие результаты, и это нормальная ситуация. Основная причина, из-за чего это происходит, либо неумение выделить в изучении социальных феноменов локального (узкого) аспекта, либо желание с помощью некоторого «приемчика» измерить то, что с его помощью не измеряется. Чтобы этого не происходило, нужно обладать определенным уровнем профессионализма.
А вот логический прямоугольник вам удался, ибо вы копировали в основном мой пример. Ведь так? Самым важным для нас при этом является не то, что «что-то» не получилось, а то, почему «это» не получилось. Для нас важнее не то, как надо делать, а то, как нельзя делать.
Вспоминаем шкалу суммарных оценок и задаемся вопросом: нельзя ли при построении одномерной шкалы (естественно в предположении, что она существует) обойтись без теоретически необоснованных «суммирований» и придумываний суждений «с потолка»? Можно, но тогда придется иметь дело с трудоемкими процедурами измерения. Одну из таких процедур рассмотрим ниже. Ее принято называть шкалой равнокажущихся интервалов.
Эта процедура, или этот метод, был предложен Л. Терстоуном (L. Thurstone) и Ю.Чейвом (Е. Chave) в 1929 году для измерения отношения к церкви. Заметьте, не к религии, а к церкви как социальному феномену. Отношение к религии — сложный социальный феномен, и его невозможно измерить с помощью одномерной шкалы. Даже на первый взгляд ясно, что бессмысленно говорить, что некто А относится к религии лучше, чем В. И в то же время при определенных предпосылках правомерно суждение, что некто А относится к церкви как социальному институту лучше, чем некто В. Шкала равнокажущихся интервалов разработана раньше, чем шкала Лайкерта. Последняя и была придумана в противовес шкале Терстоуна как более простая процедура.
Таблица 2.3.1
Форма фиксации результатов деления суждений на группы
После работы со вторым экспертом в таблице появляются в соответствующих клетках, если они были пустыми, новые «плюсы». В случае, если в клетках уже был «плюс», добавится еще один. После работы со всеми экспертами в таблице находится вся информация о «поведении» экспертов и о «поведении» суждений.
3 этап. Анализ единодушия экспертов по отношению к суждениям.
На этом этапе каждое суждение (см. строку таблицы 2.3.1) рассматривается в отдельности, чтобы оценить степень единодушия экспертов по отношению к суждению. Другими словами, мы
Как бы изучаем «поведение» суждения, т.е. в какие группы (ящички) или в какие градации (пункты) исходной порядковой шкалы попало это суждение. Для этого срока, взятая из таблицы 2.3.1, дополняется относительной частотой в % и накопленной частотой. В таблице 2.3.2 приведен пример для анализа суждения «национализм является стимулом развития культуры».
Таблица 2.3.2
Описание поведения суждения
Из первой строки таблицы видим, что 10 экспертов отнесли суждение к 4-й градации. К пятой градации отнесли это суждение 20 экспертов, к шестой ¾ 15, к седьмой ¾ 5. Всего экспертов было 50. Во второй строке ¾ доля в процентах экспертов. Отнесших суждение в соответствующую градацию, в общей совокупности экспертов. Третья строка соответствует так называемым накопленным, или кумулятивным частотам. Это очень интересный показатель при работе с порядковыми шкалами. Его удобнее интерпретировать, если перейти на язык баллов. Такой переход позволяет сделать предположение о равнокажущихся интервалах между градациями. Тогда градацию на шкале интерпретируем как балл, приписанный суждению.
В нашем случае 60% накопленной частоты (см. таблицу 2.3.2) означает, что 60% экспертов дали суждению балл, равный пяти и меньше пяти, а 90% означает, что 90% экспертов дали суждению балл. Равный шести и меньше шести. И наконец, 100% экспертов дали балл, равный семи и меньше семи. Нетрудно догадаться, что эти частоты и являются основанием для оценки единодушия экспертов. Задаемся простым вопросом, какой балл (он будет называться медианой) соответствует суждению в ситуации, когда 50% экспертов дают оценку, меньше этого балла, а 50% больше. А нужно это для того, чтобы попасть как бы в «сгусток» экспертов. Следующий вопрос, который задает себе социолог: в какой интервале вокруг медианы сосредоточены оценки 50% экспертов?
Ответы на эти два вопроса и позволяют сделать определенный вывод о единодушии экспертов относительно суждения. Эти ответы можно искать и в графической форме. На рис. 2.3.1 изображена кривая, которая называется кумулята, т.к. строится по кумулятивной (накопленной) частоте. Вы все в школе строили графики на плоскости. Ситуация аналогичная. По горизонтали откладываем градации на шкале, а по вертикали ¾ накопленную частоту.
Рис. 2.3.1 Единодушие экспертов по суждению
Медиана обозначена Ме и равна примерно 4,8. Половина интервала, в котором сосредоточены оценки 9вокруг медианы) 50% экспертов, называется квартильным размахом. Квартильный размах R равен 0,8. Разумеется, существуют математические формулы для вычисления медианы и квартильного размаха.
В результате анализа «поведения» всех суждений по каждому суждению имеем значения медианы и квартильного размаха. Теперь можем около каждой градации исходной шкалы образовать «группу» суждений, у которых медианы почти одинаковы. У нас будет девять таких групп.
4 этап. Отбор «качественных» суждений в шкалу.
При отборе необходимо, чтобы отобранные суждения равномерно покрывали исходную шкалу. Это означает в нашем случае, что, как минимум, надо отобрать девять суждений, соответственно из каждой кучки по суждению. Однозначного ответа на вопрос о числе отбираемых в шкалу суждений не существует. Все зависит от целей исследования и от того, какую социальную установку мы измеряем. Если предстоит использование разработанной шкалы в массовом опросе, то вряд ли нужно стремиться к включению большого числа суждений в инструментарий исследования.
Реально отбор происходит следующим образом. Сначала выбираем группу суждений со значением медианы «около 1» и сравниваем их квартильные размахи. Отбираем для включения в искомую шкалу суждения с минимальными квартильными размахами, т. е. суждения по которым эксперты достаточно единодушны. Чем меньше квартальный размах, тем лучше суждение. Существуют ли здесь количественные ограничения? Нет, не существуют. Затем работаем таким же образом с остальными.
При отборе суждений иногда складывается пренеприятная ситуация типа такой, когда в группе всего одно суждение и то с большим квартальным размахом. Что делать? Прежде всего не нарушать требований предыдущих этапов, чтобы такая ситуация не возникла. А коль скоро она сложилась, необходимо тщательно проанализировать суждение и найти ответы на вопросы: почему низка степень единодушия экспертов по этому суждению и почему нет других суждений в этой группе. Соответственно, решение придет само собой. Выполните задание в конце раздела и познакомьтесь со всеми нюансами построения шкалы равнокажущихся интервалов.
Вследствие реализации описанных выше четырех этапов построения шкалы можно считать, что она готова для использования в исследовании. У нас есть совокупность суждений о национализме и их медианы. Это и есть линеечка для измерения социальной установки. Как же измерить установку отдельно взятого респондента? Суждения, составляющие нашу линеечку, вставляются в различные места и вразнобой в вопросник. Респонденту предлагают согласиться или не согласиться с суждениями. Чтобы оценить отношение респондента к национализму, выписываем значения медианы для тех суждений, с которыми он согласился. Упорядочим эти значения в порядке возрастания или убывания. Все они характеризуют отношение респондента к национализму. Ищем среднюю тенденцию. Характеристикой такой тенденции считают медиану. Получается, что мы ищем как бы медиану из медиан. Она и есть значение социальной установки для респондента. Оценкой отношения респондента к национализму можно считать и среднюю арифметическую из медиан.
И наконец, возникает вопрос, как от индивидуальных оценок перейти к групповым. После рассмотрения любого приема измерения социолог задает этот вопрос, ибо сравнительный контекст для него ¾ главный. А для этого контекста нужно умение сравнивать установки различных групп. На первый взгляд является естественным вычисление простого среднеарифметического значения в группе, так как измерение социальной установки проведено по шкале, уровень измерения которой выше порядкового. Наши данные похожи на числа, ибо можем сказать во сколько/насколько больше/меньше установка одного респондента по сравнению с другим. Нельзя сравнивать группы только по средним арифметическим значениям. Необходимы еще и другие показатели, характеризующие характер распределения оценок социальной установки в группе. К этим вопросам вернемся в соответствующем разделе книги.
Завершая рассмотрение этой красивой процедуры, следует обратить внимание на ее отличие от процедуры построения шкалы суммарных оценок. Социологу приходится платить за все. Если нужно хорошее качество, то его достижение трудоемко. Если нужна простота, то приходится жертвовать качеством. Несмотря на то, что в шкале Лайкерта предусмотрена проверка исходных суждения на пригодность, все-таки в шкале Терстоуна эта проверка глубже и качественнее. Если в первом случае операция сложения теоретически необоснованна, то во втором мы не допустили ни одного нарушения. По шкале Лайкерта мы получаем порядковый уровень измерения, а по шкале Терстоуна ¾ метрический. Следует сравнить эти шкалы и с точки зрения респондента. Для респондента проще шкала Терстоуна, так как от него требуется лишь реакция согласия/несогласия на суждения.
Вы, конечно, обратили внимание, что чем сложнее процедура, тем труднее отделить друг от друга, разделить две процедуры: измерение и анализ данных. Всепереплетается сам подход к измерению порождает и определенный прием анализа эмпирических данных. Психологи и социологи пользуются терминами «диагностическая процедура», «диагностическая методика», имея в виду подход/направление/прием изучения социальных феноменов. В подобного рода процедурах эти переплетения являются естественными. Проистекают эти термины из тестовой традиции изучения социальных феноменов.
Рассмотрим еще одну диагностическую традицию. Речь по-прежнему идет об одномерном шкалировании. Эта традиция опирается на специфическую модель измерения. В рамках этой модели рассмотрим две шкалы: Богардуса и Гуттмана. Первую принято называть шкалой социальной дистанции.
Шкала социальной дистанции
Если обратиться к истории разработки первых шкал измерения социальных установок, то имя Эмори Богардуса (Е. Bogardus) примечательно тем, что он считал, что количественное измерение необходимо дополнять качественной информацией. Например, измерение расовых установок он дополнял личными интервью с респондентами. Для измерения отношения к определенной расе Богардус использовал один-единственный вопрос, обращенный к респонденту. Он имеет следующий вид:
«Я согласен иметь дело с представителями определенной расы:
1) в качестве близких по браку;
2) в качестве личных друзей в моем клубе;
3) в качестве жителей моей улицы;
4) в качестве моих сослуживцев;
5) в качестве граждан моей страны;
6) только в качестве туристов».
Во-первых, перечисленные виды «взаимоотношений» можно считать вариантами ответа на вопрос. Тогда это эмпирический индикатор сложной структуры или вопрос с совместными альтернативами. При этом респондент выбирает сразу несколько вариантов ответа. Во-вторых, этот вопрос можно считать совокупностью шести эмпирических индикаторов, имеющих номинальный уровень измерения и принимающих два значения. Такие индикаторы, как уже отмечалось, называются дихотомическими. Опираясь на приведенный пример, можно рассмотреть, например, задачу измерения отношения представителей различных национальностей к русским. Тогда вопрос, обращенный к респонденту, может звучать так:
Таблица 2.3.3
Результаты опроса девяти респондентов
Подсчитываем число баллов (+), набранных суждением по всей совокупности опрошенных. Они представлены в итоговой строке таблицы 2.3.3. В последнем столбце таблицы представлены баллы, набранные респондентом. Эти баллы можно было бы считать оценками отношения к «новым русским», если бы совокупность суждений (как в шкале Богардуса) была строго иерархической. Но такой уверенности у нас пока нет. Мы не знаем, насколько ответы отдельно' взятого респондента согласованы с итоговой иерархией:
Е>А>Г>Б>Д>В
Таблица 2.3.3 дает возможность проверки гипотезы о том, что совокупность суждений имеет иерархическую структуру. Другими словами, мы можем проверить качество шкалы, качество совокупности оценок, представленных в итоговом столбце.
3. Проверка качества шкалы.
Произведем преобразование таблицы для целей определения согласованности ответов респондентов. Переставим суждения в соответствии с убыванием набранных ими баллов. Затем поменяем порядковые места респондентов также в соответствии с убыванием баллов. Переставляем так, чтобы в верхней части таблицы были сосредоточены (+), а в нижней (-)! Для нашего модельного примера результаты изображены в таблице 2.3.4.
Идеальной шкалограммой называется табличка, в которой (.+) четко (лесенкой) отделяются от (-). Естественно, на практике этого не будет. Будут появляться (+) под лесенкой и (-) над лесенкой, т. е. будет наблюдаться отклонение от идеальной ситуации.
Таблица 2.3.4
ПРИЕМЫ ИЗМЕРЕНИЯ СОЦИАЛЬНОЙ УСТАНОВКИ
Шкала Луи Терстоуна. Шкала Эмори Богардуса. Шкалограммный анализ Луи Гуттмана. Сходство и различие шкал Лайкерта и Терстоуна. Сходство и различие шкал Богардуса и Гуттмана.
Мы продолжаем рассматривать приемы одномерного шкалирования. Вы уже убедились в том, как трудно на практике придумать логический квадрат, шкалу суммарных оценок. У многих наверняка получились не очень хорошие результаты, и это нормальная ситуация. Основная причина, из-за чего это происходит, либо неумение выделить в изучении социальных феноменов локального (узкого) аспекта, либо желание с помощью некоторого «приемчика» измерить то, что с его помощью не измеряется. Чтобы этого не происходило, нужно обладать определенным уровнем профессионализма.
А вот логический прямоугольник вам удался, ибо вы копировали в основном мой пример. Ведь так? Самым важным для нас при этом является не то, что «что-то» не получилось, а то, почему «это» не получилось. Для нас важнее не то, как надо делать, а то, как нельзя делать.
Вспоминаем шкалу суммарных оценок и задаемся вопросом: нельзя ли при построении одномерной шкалы (естественно в предположении, что она существует) обойтись без теоретически необоснованных «суммирований» и придумываний суждений «с потолка»? Можно, но тогда придется иметь дело с трудоемкими процедурами измерения. Одну из таких процедур рассмотрим ниже. Ее принято называть шкалой равнокажущихся интервалов.
Эта процедура, или этот метод, был предложен Л. Терстоуном (L. Thurstone) и Ю.Чейвом (Е. Chave) в 1929 году для измерения отношения к церкви. Заметьте, не к религии, а к церкви как социальному феномену. Отношение к религии — сложный социальный феномен, и его невозможно измерить с помощью одномерной шкалы. Даже на первый взгляд ясно, что бессмысленно говорить, что некто А относится к религии лучше, чем В. И в то же время при определенных предпосылках правомерно суждение, что некто А относится к церкви как социальному институту лучше, чем некто В. Шкала равнокажущихся интервалов разработана раньше, чем шкала Лайкерта. Последняя и была придумана в противовес шкале Терстоуна как более простая процедура.