Основные модификации многомерного шкалирования: метрическое и неметрическое, индивидуальное, многомерное развертывание.
Разделение шкалирования на метрическое и неметрическое основывается на уровне измерения исходных данных о близости между измеряемыми объектами. Впервые различие между метрическим и неметрическим шкалированием было сформулировано Кумбсом, который и ввел эти термины.
Метрическое многомерное шкалирование.
Мы не будем подробно останавливаться на методах метрического многомерного шкалирования. Это объясняется тем, что используемая ими информация не соответствует основной задаче многомерного шкалирования в социологии. Метрические исходные данные о близости обычно являются «производными», и
многомерное шкалирование в этом случае, как уже было сказано, служит способом понижения размерности пространства. В тех же случаях, когда данные получаются непосредственно от респондентов, они обычно задают для близостей отношения порядка и для достижения метрического уровня измерения к ним применяются любые методы одномерного шкалирования, дающие на выходе шкалу для близостей не ниже интервальной. В этом случае на исходные данные накладывается (в зависимости от конкретного метода)
ряд дополнительных предположений, которые отсутствуют в эмпирической системе с
отношениями и которых хотелось бы избежать.
Говоря о методах метрического многомерного шкалирования, отметим только, что по типу отображения они делятся на линейные и нелинейные. Линейное метрическое шкалирование возникло первым, когда Торгерсон представил подробное описание алгоритма, начиная от процедуры сбора данных и кончая пространственным
представлением. Более поздние методы метрического многомерного шкалирования основаны на минимизации нелинейных функций несоответствия (критериев качества отображения) между исходными данными и пространственным представлением. В этом отношении они почти ничем не отличаются от методов неметрического многомерного шкалирования. Отличия этих методов заключены в самом виде функции несоответствия и объясняются различным уровнем измерения исходной Метрическим методам многомерного шкалирования посвящена довольно обширная литература, и желающие познакомиться с ними могут обратиться к аналитическому обзору этих методов, проведенному А.Ю. Терехиной31.
Неметрическое многомерное шкалирование. Вторая основная фаза развития методов многомерного шкалирования началась в 1962 г. и связана с именем Шепарда. В его статье был представлен алгоритм, известный под названием «анализ близостей»32. Эта работа положила начало целому направлению, методы которого получили название методов неметрического многомерного шкалирования.
Особенность этих методов заключается в том, что в них учитываются не числовые значения близостей между объектами, а только их порядок. Это позволяет использовать только ту информацию, которую мы получаем непосредственно от респондентов, не прибегая к дополнительным предположениям. Именно в связи с этим методы неметрического многомерного шкалирования оказываются наиболее подходящими для решения задачи построения пространства восприятия респондентов и определения
положения объектов в этом пространстве. Алгоритм Шепарда не нашел широкого применения, так как многие процедуры в нем не были формально обоснованы. Однако идеи, заложенные в этом подходе, послужили
базисом для появления работ Краскала33. Предложенная им модификация и явилась, по сути дела, первым теоретически обоснованным алгоритмом многомерного шкалирования. В настоящее время алгоритм Краскала является одним из наиболее распространенных.
Билет 20.
1. Задачи, решаемые с помощью техники семантического дифференциала.
Итак, исследователя интересует аффективная составляющая смыслов, придаваемых респондентами некоторым объектам. Составляется множество пар терминов (Осгудом было придумано несколько сот таких пар), каждая из которых отвечает некоторому коннотативному непрерывному признаку (термины из соответствующей пары отвечали его полюсам): горячий — холодный, хороший — плохой, грязный — чистый и т.д. Диапазон изменения каждого такого признака разделяется на 7 частей, тем самым признаку ставится в соответствие семизначная шкала.
Чтобы было ясно, чему должны отвечать градации нашей семизначной шкалы, заметим, что, скажем, паре"светлый — темный" соответствуют примерно следующие выражения и шкальные значения: очень светлый 3 , светлый 2, не очень светлый 1, ни светлый, ни темный О, не очень темный —1, темный —2, очень темный —3.
Как мы увидим ниже, в анкете не обязательно осуществлять все подобные расшифровки пунктов шкалы, равно как не обязательно использовать именно названные числа: можно брать числа от 1 до 7 и т.д. Более того, иногда можно изменить количество градаций: скажем, прибегнуть к пятибалльной шкале. Вопрос о количестве используемых градаций неотделим от вопроса о типе используемых шкал, который мы теперь хотим затронуть.
Часто о шкалах, задействованных в методе СД, по вполне понятным причинам говорят как о порядковых. Но та обработка, которую предполагает техника СД, фактически рассчитана на интервальные шкалы (речь идет об использовании факторного анализа, применении "числовых" алгоритмов классифика-ции и т.д.). Выше (в пп. 5.2.3 и 7.5.1) мы уже говорили о том, что при достаточно большом количестве используемых градаций предположение об интервальное™ задействованных шкал может быть вполне допустимым. Этим и можно воспользоваться для оправдания указанного шага.
Опрос осуществляется следующим образом. Респондентам по очереди предъявляются для оценивания рассматриваемые объекты и предлагается соотнести интенсивность своего внутреннего ощущения по поводу того или иного объекта по очереди со всеми оценочными шкалами. Каждый объект должен быть оценен каждым респондентом по всем рассматриваемым шкалам.
Приведем пример соответствующего измерительного инструмента, предназначенного для решения одной из конкретных социологических задач методом СД (табл. 8.1). Речь идет об исследовании аффективной составляющей социальной идентичности личности. В качестве объектов идентификаци оцениваемых объектов выступали важные и близкие человеку социальные общности и группы.
Таким образом, полученная с помощью метода СД информация, будучи компактно размещенной в пространстве, образует трехмерный параллелепипед, осям которого отвечают соответственно респонденты, объекты, шкалы. Если мы опрашивали 500 человек, давали им для оценки 20 объектов и каждый из объектов просили оценить по 50 шкалам, то упомянутый параллелепипед будет иметь размерность 500x20x50.
Существует масса способов, которыми можно анализировать подобную информацию, и соответственно масса задач, которые при этом можно решить. В числе этих задач — те, о которых мы говорили выше. Прежде чем перейти к более подробному их рассмотрению, заметим следующее.
Большинство методов многомерного анализа рассчитаны на то, что исходные данные представлены в виде так называемой матрицы "объект—признак". Это прямоугольная таблица, строки кото-
Матрица "объект—признак" двумерна. Методы, позволяющие на основе анализа такой матрицы выявлять скрытые в ней статистические закономерности, направлены на ее "сжатие". Так, факторный анализ сжимает матрицу по столбцам: мы выделяем "пучки" связанных друг с другом признаков, усматривая за каждым из них действие одного латентного фактора, который можем выразить через наблюдаемые переменные (об этом мы говорили в п. 7.2). Методы классификации сжимают матрицу по строкам: мы объединяем схожие между собой объекты в кластеры, олицетворяя каждый такой кластер с неким типичным для него объектом и т.д.
У нас же совокупность исходных данных трехмерна. Для того чтобы можно было говорить о применении традиционных методов многомерного анализа, необходимо устранить третье измерение. Сделать это можно по-разному. Способ зависит от решаемой задачи. Прежде всего рассмотрим, как анализировал описанные данные сам Осгуд.
Одним из наиболее ярких примеров использования техники СД отнюдь не для поиска семантического пространства является ее применение в так называемых методиках ГОЛ (групповой оценки личности)