Классификация методов шкалирования
Более чем за 50-летнюю историю эмпирических социологических исследований было разработано большое количество шкал, иначе говоря, процедуры количественного представления социальных явлений. В настоящее время социологические шкалы различаются прежде всего по трем моментам: природе шкалируемого социального явления, уровню числового представления, способам получения числового представления.
Первый момент относится к природе явлений. Одно дело, когда изучается социальная установка группы лиц, другое — когда измеряется степень спаянности этой группы. Историческитаксложилось, что социологами наиболее разработаны шкалы измерения социальных установок, а также техника измерения структурных особенностей группы, так называемая социометрия, хотя это разграничение весьма относительно, поскольку социометрия основана на изучении предпочтения, а последнее связано с установкой.
Вместе с тем, изучая группу лиц по социальным установкам, в определенной степени изучают и структуру группы. Однако социологическое исследование не исчерпывается изучением структуры группы. Как измерить микрокультуру группы, уровень социализации индивида, степень влияния друг на друга членов определенной неформальной группы? Можно поставить множество подобных вопросов. Измерить субкультуру группы значительно сложнее, чем установку отдельного индивида, поскольку субкультура — это сложное явление, которое складывается из сочетания отдельных установок. Говоря математическим языком, субкультура — это многомерное явление, тогда как установка — одномерное. Последнее утверждение тоже весьма условно, так как установка — синтез сознательных н бессознательных ориентации и подсознательных влечений; мы полагаем, что этот синтез реализуется на каком-то одномерном непрерывном континууме. Измерить социальную установку индивида — означает определить его положение на этом гипотетическом континууме. Все развитые социологические шкалы установок и предлагают различные методы такого расположения.
Естественно, что при решении проблемы измерения и шкалирования в каждой отрасли социологии имеется своя специфика, что следует относить к содержательной стороне социального явления. Но в то же время природа социального явления обладает формой существования, которая включает три составляющие, а именно: континуум, связь, структуру.
Для измерения структуры группы была разработана социометрическая техника и различные варианты многомерного анализа (факторный анализ, латентно-структурный анализ, причинный анализ, многомерное шкалирование, таксономия). При измерении связи использовалось большое многообразие коэффициентов корреляции.
Классическим примером измерения континуума является определение социально-экономического статуса как измерение некоторой гипотетической непрерывной величины. Статус складывается из образования и материального дохода. Ясно, что статус больше у того, у кого больше образование и доход. А как быть с теми, у кого образование меньше, а доход больше, или наоборот?
Предположим, что мы оцениваем качество лекции по трем факторам — содержанию (С), интересу (И), технике (Т). Могут быть следующие варианты оценок:
Строка | C | И | Т | Строка | С | И | Т |
I | + | + | + | V | − | − | + |
II | + | + | − | VI | − | + | − |
III | + | − | + | VII | + | − | − |
IV | − | + | + | VIII | − | − | − |
Знаком «плюс» обозначаем присутствие данного фактора в лекции, знаком «минус» — его отсутствие.
Сразу определяются две полярности качества лекции: одна полярность характеризуется всеми тремя положительными значениями факторов, другая — тремя отрицательными значениями этих факторов. Все прочие возможности находятся где-то между этими двумя полярностями. Качество лекции представляет собой как бы некий континуум, обладающий нижней и верхней границей. Эти границы являются граничными, предельными показателями. Эмпирически, операционально они фиксируются в трех одновременно положительных и одновременно отрицательных значениях факторов. Любой другой эмпирический вариант сочетания факторов является показателем промежуточного положения качества соответствующей лекции на этом континууме. При предположении равноправности рассматриваемых факторов естественно полагать, что два положительных ответа являются показателем более высокого качества лекции, чем при одном положительном ответе. В этом случае восемь вариантов ответов конструируют нам четыре показателя качества лекции: строка I — отличное; строки II — IV — хорошее; строки V — VII — удовлетворительное; строка VIII — неудовлетворительное. Но не яв-
ляется ли это слишком большим упрощением? На самом деле, можно ли считать лекцию удовлетворительного качества, если она малосодержательна? Приходится строки IV — V отнести к неудовлетворительному уровню и, следовательно, конструирование меры качества становится иным. Наличие двух полярностей означает существование между ними континуума и дает основание для построения шкалы.
Второй момент в классификации методов шкалирования связан с уровнями (шкалами) числового представления, предложенными Стивенсом. Существуют два фундаментальных аспекта теории измерения — определение информации, содержащейся в наблюдении на фенотипическом уровне, и определение отношения между генотипическим и фенотипическим уровнями. Этиобааспекта обеспечивают базис для осуществления генотипических выводов из наблюдений.
Наблюдаемые данные (ответы на вопросы) — это фенотипический (наблюдаемый, эмпирический) уровень. Внутренний механизм, обусловливающий эти ответы, — генотипический уровень. К генотипическому уровню относятся установки, убеждения, способности и т.п. Проблема двоякая: во-первых, каковы измерительные свойства шкалы; во-вторых, к какому уровню — фенотипическому или генотипическому — относится шкала[135]. Соответственно возникает разделение шкал на две группы — фенотипические и генотипические. Если в психологии, психометрике и психофизике можно выделить пять групп шкал — фенотип-ординальные, фенотип-интервальные, фенотип-пропорциональные, генотип-интервальные, генотип-пропорциональные, то в социологии при такой логике классификации все методы шкалирования образуют только две группы — фенотип-ординальные и генотип-интервальные. Фенотип-ординальные методы дают ординальную шкалу на фенотипическом уровне. Это методы ранжирования, ранговых категорий, шкалограммный анализ Гутмана, техника развертывания Кумбса. Генотип-интервальные методы дают интервальную шкалу измерения на генотипическом уровне. Это метод парных сравнений, основывающийся на законе сравнительного суждения Терстона[136]. Существо метода парных сравнений может быть изложено следующим образом.
Закон сравнительного суждения имеет вид:
S — S = x
где S и S — шкальные значения сравниваемых стимулов, x — величина, соответствующая вероятности того, что стимул 1 предпочтительнее стимула 2; ó1 и ó2 — дисперсии стимулов; r — корреляции между стимулами.
В зависимости от того, какие величины даны в правой части, различают пять случаев закона Терстона. Простейший вариант имеет вид:
S — S = x ó = z
z — это вероятности, но практически приходится принимать частоты за вероятности. Чаще всего производится многократное сравнение, и за вероятности принимаются усредненные частоты. По Терстону, эксперты оценивают каждую пару установок в отношении предпочтения. В квадратной таблице ставят процент экспертов, оценивших данную пару. Если все различия подчиняются нормальному закону, то эти проценты рассматривают как площади под нормальной кривой и в таблицах нормального распределения находят соответствующие абсциссы. По каждому столбцу они складываются, что дает интервальный балл каждой установке по данной группе экспертов.
Третий момент связан с тем, что шкала получается путем оценки, самооценки, сравнения, экспертного суждения и т.п.
Это последнее направление в классификации методов шкалирования включает две основные проблемы — характер инструментария измерения и процедуру приписывания баллов (мер, индексов). Первая проблема дает следующий перечень альтернатив (далеко не полный): отдельный вопрос, вынужденный выбор, множественный выбор, косвенные меры, физиологические меры и т.п. Вторая проблема может быть разрешена посредством экспертных оценок, суммарных шкал, кумулятивных шкал и т.д.[137]
Проблема измерения, как мы уже отмечали, включает два аспекта — логико-теоретический и эмпирический, операциональный. Логико-теоретический аспект связан с характеристикой числовой системы. Эмпирический аспект означает множество операций над самими объектами, посредством которых можно наблюдать некоторые свойства этих объектов таким образом, чтобы удовлетворить определенным аксиомам числовой системы. Если отвлечься от специальных математических вопросов, то для социологии актуальны два момента современной теории измере-
ния: во-первых, способ выявления выполнимости аксиом порядка в эмпирической системе и, во-вторых, выявление и характеристика промежуточных шкал, например таких, как частично упорядоченная шкала, т.е. выявление математических свойств эмпирических систем, часть членов которых удовлетворяет аксиомам порядка, а часть — аксиомам равенства.
Вопрос о специфике именно социологического измерения имеет давнюю историю, хотя по сегодняшний день он остается открытым. Еще Г. Морфи в середине 30-х годов различал психологическое измерение как получение индивидуального балла в отношении рассматриваемой установки, а социологическое измерение — как измерение установки на основе групповых данных, полученных на основе вопросника.
В процедуре измерения в соответствии с его двумя аспектами выделяются два подхода. Первый связан с характеристикой и особенностями числовых систем, на которых оно реализуется, и определяет типы или уровни измерения (номинальный, порядковый, интервальный, числовой). Второй подход акцентирован на выявлении путей, посредством которых результируется измерение. Этот подход приводит к двум видам измерения — производным и фундаментальным. Квадранты Кумбса — основа для классификации методов измерения, однако полная их систематизация в социологии еще не осуществлена.
Мы можем задать себе вопрос в отношении некоторого человека, с одной стороны, нравится ли он вам или нет, с другой — занимается, например, он спортом или нет. В первом случае эмпирические данные будут отражать отношение этого человека к нашему предпочтению, идеалу. Во втором — данные отражают отношение этого человека к определенному атрибуту (хороший). Известный психолог и социолог Кумбс это различие обозначил как две задачи: А и В[138]. Задача А — это оценка суждения объекта, признака, вопроса, т.е. реализации предпочтения (например, я выбираю таких друзей в силу того, что их взгляды близки моим взглядам, привязанностям, наши мнения совпадают. Задача В — оценка суждения относительно соответствующего атрибута, т.е. выявление содержания (продолжая идею предыдущего примера, можно сказать, что в этом случае выбор таких друзей происходит в силу того, что они принадлежат к одной партии, одному поколению, что они имеют одинаковое семейное и общественное положение, и т.п.). Задача А — это соотношение вопроса и субъекта, задача В — соотношение вопроса анкеты и атрибута, объекта.
Специфика природы данных и эмпирических показателей также связана с относительностью и безотносительностью поведения при ответах на вопрос. При относительном поведении ответ выражает отношение двух или более вопросов, т.е. возможен выбор: в случае задачи А спрашивается, какой из данных пунктов предпочитается, в случае задачи В — какой из данных пунктов обладает большей характеристикой. При безотносительном поведении мы рассматриваем ответ на отдельный вопрос, не связанный со сравнением: в случае задачи А — это пример с арифметическим тестом, в случае задачи В — это шкала оценки (например, требуется оценить по шкале «знает — не знает» знания данного студента).
Эти два подхода — задачи А и В и относительное и безотносительное поведение — в характеристике данных эмпирического социологического исследования наглядно представлены с помощью квадрантов Кумбса[139]:
Безотносительное поведение | Относительное поведение | |
Задача А | II | I |
Задача В | III | IV |
Это можно представить на более формальном языке с помощью трех альтернатив: 1) отношения на паре точек или паре расстояний; 2) элементы пары — из одного множества или из разных множеств; 3) отношения — или отношение — порядка или близости (рис.14).
Четыре класса, образованные перекрестным делением первых двух дихотомий, обозначены квадрантами от I до IV, а дополнительное деление дается отношениями порядка (>) и близости (0), которое делит квадранты на две части — а и b соответственно.
Наблюдаемое поведение в квадранте I — на паре расстояний, где каждое расстояние — между парой точек из различных множеств (обычно это индивиды и стимулы). Контекст реального мира, в котором наиболее часто можно получить этот вид
данных, состоит в наблюдении предпочтительного выбора индивида среди множества стимулов. Данные могут рассматриваться как сравнение различий индивид — стимул или как так называемые данные предпочтительного выбора.
Наблюдаемое отношение в квадранте II — на паре точек, которые взяты из различных множеств (обычно это индивиды и стимулы). Такие данные называются данными простого стимула. Важно отметить, что они включают в себя не только данные
Рис. 14
психологического тестирования, выявления мнения и психофизических порогов, но также рейтинг-шкалы, метод последовательных интервалов и то, что называется данными абсолютного суждения.
Наблюдаемое поведение в квадранте III — на паре точек, которые взяты из одного и того же множества (они суть стимулы). Это данные сравнения стимулов. С таким видом данных мы имеем дело в социометрнческих матрицах.
Наблюдаемое поведение в квадранте IV — на паре расстояний, где каждое расстояние — между парой стимулов. Это данные сравнения, различий стимулов. Ввиду того что это поведение типично при ответе на относительное подобие стимулов, то они еще называются данными подобия. Следовательно, содержание квадрантов можно представить таким образом:
Данные простого стимула | Данные предпочтительного выбора или сравнения различий индивид – стимул |
Данные сравнения стимулов | Данные подобия или сравнения различий стимулов |
Кумбс различает методы сбора и методы анализа данных, хотя некоторые методы, например метод последовательных интервалов Терстона, могут выступать и в качестве первых, и в качестве вторых. Методы сбора классифицируются по указанным квадрантам следующим образом:
I квадрант включает методику развертывания, предложенную Кумбсом;
II — III квадранты — методы тестирования и метод шкалирования по Лайкерту;
IV квадрант — метод последовательных интервалов по Терстону.
Методы анализа можно сгруппировать так:
I квадрант включает шкалограммный анализ Гутмана;
II — III квадранты — латентно-структурный анализ Лазарсфельда;
IV квадрант — метод последовательных интервалов Терстона.