Общее представление о шкалировании как измерении
Впсихофизике были разработаны общепсихологические представления об уровнях психологических измерений или типах шкал, послужившие основой методологии всех психологических измерений, или психологического шкалирования. В основе субъективных измерений лежит процедура приписывания чисел элементам из некоторого множества оцениваемых феноменов психической реальности человека (образы ощущений, восприятий, эмоциональные переживания и т.д.). Это приписывание должно производиться по некоторым правилам. Правила заключаются в том, чтобы определенные отношения, которые установлены для чисел, выполнялись также и на соответствующем множестве психических феноменов; в зависимости от того, какие именно отношения можно установить на данном множестве, строится и соответствующая шкала измерения. Рассмотрим общее представление о субъективных измерениях и варианты их классификации.
Значение психологических измерений не ограничивается только тем, что они более строго обозначают неопределенные или расплывчатые суждения типа «звук низкий» или «этот человек
1 С работами Н.Диксона и других исследователей можно ознакомиться в обзоре «Подсознательное восприятие», опубликованном ИНИОН АН СССР в 1980 г. [39].
общительный» с помощью таких количественных оценок, как «высота звука равна 80 мелам»1 или «этот человек имеет ранг 7 по 10-балльной шкале общительности». Значение числовых оценок важно прежде всего тем, что они позволяют применять математические методы к данным эмпирических исследований, а затем формулировать количественные законы, являющиеся неотъемлемой частью любой науки. Кратко рассмотрим три важнейшие составляющие процесса измерения: природу объекта измерения, используемые средства и его результат.
Наиболее общее и простое определение понятия «измерение» принадлежит Н.Кэмпбеллу [138] и С.Стивенсу [104], определивших его как приписывание чисел объектам или событиям в соответствии с определенными правилами, тем самым подчеркнувших необходимость определенных условий для осуществимости измерений.
Рассмотрим данное определение подробнее. Допустим, что мы имеем дело с некоторым эмпирическим множеством измеряемых объектов, например: испытуемые, у которых необходимо измерить креативность. В теории измерений данное множество называют системой эмпирических объектов с отношениями, имея в виду, что на данном множестве объекты связаны между собой определенными отношениями:
Е=<Е,ЯЕ>, (19)
где Е — непустое множество эмпирических объектов, а ЯЕ — непустое множество некоторых отношений между ними.
Под отношением понимается возможность соотнесения объектов по определенному признаку (характеристике); например: отношение эквивалентности определяет возможность установления равенства двух или нескольких объектов, отношение порядка позволяет оценить большую или меньшую выраженность какого-либо признака и т.д. Аналогичным образом вводится понятие числовой реляционной системы как совокупности множества чисел (например, множество целых чисел) и множества отношений:
7У=<УУ, К„>. (20)
Суть измерения, таким образом, заключается в приписывании объектам числовых значений так, чтобы отношения, имеющиеся в эмпирической системе, адекватно отображались (т.е. переносились, соответствовали) на числовом множестве. В результате проведенного измерения на множество чисел передаются только те отношения, которые могут быть установлены между измеряемыми объектами. Возвращаясь к нашему гипотетическому примеру, подчеркнем, что если мы проводили простое ранжирование груп-
1 Мел — единица измерения высоты звука.
пы из 10 испытуемых по креативности (сейчас не важно с помощью какой процедуры), т.е. устанавливалось отношение порядка, то полученный результат — числовая система с конечным множеством чисел 1 до 10 — будет включать в себя также отношение порядка. Таким образом, формализованное определение понятия «измерение» может быть задано как упорядоченная тройка:
<Е, УУ, Р>,
где Р — взаимно-однозначное соответствие, позволяющее преобразовать Е в N.
Такое бинарное отношение называют гомоморфизмом, подчеркивая тем самым, что в отличие от изоморфизма взаимно-однозначное соответствие устанавливается не в полном объеме, т.е. не все свойства эмпирических объектов и, конечно же, не все свойства чисел могут однозначно соответствовать друг другу. Имеется в виду то, что лишь некоторые свойства объектов могут быть строго отображены с помощью математических правил некоторыми свойствами чисел.
В соответствии с характером отношений, устанавливаемых на множестве измеряемых объектов, результаты измерения могут быть более или менее строгими (например, качественными или количественными) или иметь различный уровень. Дальнейшая разработка проблемы уровней измерения нашла свое отражение в классификации типов измерительных шкал. Понятие шкалы тесно связано с понятием измерения, поскольку шкала как последовательность числовых значений является непосредственным его результатом. В психологической литературе рассматриваются как одномерные, так и многомерные шкалы. В первом случае отдельные объекты эмпирической системы отображаются в числовой системе одним единственным числом. Во втором — каждому объекту соответствует несколько чисел, отображающих различные характеристики измеряемого объекта.
Наиболее распространенной в психологии классификацией шкал как уровней измерения является классификация С. Стивен-са [104], хотя ряд других математических психологов также внес серьезный вклад в разработку данной проблематики [15].
Типы шкал
Основой для классификации С. Стивенса являются следующие понятия:
1) эмпирические отношения, которые устанавливаются на множестве измеряемых объектов;
2) допустимые преобразования, возможные на шкале, которые определяют математическую структуру шкалы. Допустимыми преобразованиями над шкальными значениями (числами) называ-
ются такие математические преобразования, которые не меняют смысла проведенных измерений.
Шкала наименований, или номинальная шкала, является самой простой и самой «слабой» из всех шкал. Как отмечает С. Стивене, некоторые авторы даже не относят эту шкалу к измерениям вообще. Числа используются здесь в качестве ярлыков, меток для обозначения или наименования одинаковых или разных категорий объектов на основе их общих характеристик. Например, шкала из 16 цветов компьютерной палитры: 1 — красный, 2 — зеленый, 3 — синий, 4 — желтый и т.д. Вместо чисел для обозначения цветов могут в равной степени использоваться слова или буквы. В рамках шкалы наименований на множестве эмпирических объектов устанавливается только одно отношение — эквивалентности или равенства (неравенства). Числа, которые используются для отображения данного отношения, передают, соответственно, только его, и, следовательно, объекты могут быть оценены только как равные или неравные друг другу. Правило, по которому воспринимаемым цветам приписываются числа, крайне просто: разным цветам приписываются разные числа (имена), одинаковым — одинаковые. Фактически при построении номинальной шкалы происходит разбиение множества эмпирических объектов на п классов, где каждый класс обозначается отдельным числом.
Поскольку никаких других отношений кроме эквивалентности на шкале наименований не устанавливается, то и допустимые преобразования со шкальными значениями столь обширны, что возможно любое взаимно-однозначное изменение. Это означает, что вместо одного числа может быть подставлено любое другое, но только с одним ограничением: изменения должны быть взаимны (учитывать эквивалентность/неэквивалентность всех чисел-наименований) и однозначны (переименовываться должны все одинаковые числовые формы). Обращаясь к предыдущему примеру, подобное взаимно-однозначное изменение может быть при использовании цифр таким: 2 — красный, 3 — зеленый, 4 — синий, 1 — желтый. Или таким: К(гес1) — красный, С(§гееп) — зеленый, В(Ыие) — синий, У(уе11о^) — желтый. Проделав одну их таких трансформаций шкалы наименований, мы не нарушили инвариантности основного отношения, заданного на этой шкале, — отношения эквивалентности; по-прежнему разные цветовые ощущения получили разные наименования, и не так важно, что использовалось для их обозначения числа либо буквы.
Шкала порядка — в психологических измерениях получается в результате использования процедуры ранжирования. В соответствии с названием данной шкалы некоторая эмпирическая процедура должна устанавливать на множестве измеряемых объектов отношение порядка, или, что то же самое, эти объекты могут быть упорядочены по выраженности определенного качества. По срав-
нению со шкалой наименований устанавливаются отношения более высокого уровня, включающие в себя отношения эквивалентности. В этом случае на числовое множество переносятся порядковые свойства, и, следовательно, числовые шкальные значения могут оцениваться друг относительно друга как большие или меньшие.
Естественно предположить, что если числовые значения шкалы передают более строгие отношения, установленные на множестве эмпирических объектов, то набор допустимых преобразований, не изменяющий инвариантность шкалы, должен закономерно сужаться. Такое предположение выглядит вполне оправданным, если мы обратимся к свойствам отношения порядка. Действительно, когда необходимо сохранить инвариантность установленных отношений, то уже не все взаимно-однозначные отношения допустимы при изменении шкальных значений, а только такие, которые сохраняют порядок расположения чисел на шкале. Очевидно, что любая монотонно возрастающая функция будет адекватна в качестве такого допустимого преобразования, и ее использование не исказит отношений порядка. Рассмотрим гипотетический пример шкалы порядка. Пусть методом ранжирования получена порядковая шкала цветовых предпочтений:
голубой — зеленый — оранжевый — белый — фиолетовый — красный — коричневый
... 10 ........... 7 ................ 6.................. 5 ................ 4................... 3................. 1 .....
Отметим, что числовые значения шкалы характеризуют степень предпочтения испытуемым указанного сверху цвета: чем больше число, тем выше предпочтение. Вместе с тем следует помнить, что полученные числа отображают лишь порядковые отношения на множестве цветовых предпочтений и не несут больше никакой количественной информации. Вопрос о том, насколько предпочтение голубого цвета зеленому отличается от предпочтения белого фиолетовому, был бы поставлен некорректно, поскольку числа 10, 7, 5 и 4 связаны между собой только одним отношением «больше» или «меньше» и не несут информации о том, насколько больше или насколько меньше. Что изменится, если мы, начиная справа, будем прибавлять к каждому числу по единице, умножая полученную сумму на количество сделанных шагов? После трансформации получим:
голубой — зеленый — оранжевый — белый — фиолетовый — красный — коричневый
... 17 .......... 13................ 11 ................ 9.................. 7................... 5.................. 2 ....
Использовав такое монотонное преобразование значений шкалы, мы не исказили порядковые отношения между ними — шкала осталась инвариантной относительно сделанных изменений. Очевидно, что то же самое было бы получено после умножения всех чисел на константу или прибавления какого-либо числа.
Шкалы наименований и порядка называются неметрическими, поскольку в обычном смысле этого слова они не дают количественного выражения измеряемых величин. В отличие от них следующие две шкалы — метрические.
Шкала интервалов — здесь задается единица измерения, т.е. вводится мера оцениваемого качества, поэтому на множестве эмпирических объектов могут быть установлены более сложные количественные отношения: на сколько больше или на сколько меньше. Хорошо известный пример шкалы интервалов — температурная шкала Цельсия. Две условные точки на шкале (0 — точка замерзания, а 100 — точка кипения воды) ограничивают отрезок, разделяемый на 100 равных интервалов. Таким образом, определенная часть ртутного столба, соответствующая 1/100 указанного выше отрезка, принимается за единицу измерения — 1 градус по шкале Цельсия. Температурная шкала Фаренгейта устроена подобным образом, ее отличие от шалы Цельсия состоит в том, что вводятся другая произвольная нижняя и верхняя точки и, соответственно, меняется величина единицы измерения — 1 градус по Фаренгейту. Данный пример хорошо иллюстрирует два основных свойства шкалы интервалов: условность нулевой точки на шкале и наличие единицы измерения.
Допустимыми преобразованиями для шкалы интервалов будут любые линейные трансформации, задаваемые формулой: х = ах + Ь. Примером сохранения температурной шкалой интервалов инвариантности может служить перевод значений температур из шкалы Цельсия в шкальные значения по Фаренгейту:
Г(х')= 9/5[С°(х) + 32]. (21)
Сравним разницы температур двух летних и двух осенних дней. Допустим, что температура в один из летних дней была 25 градусов по Цельсию, а в сравниваемый с ним день осенью — 15 градусов. В два других дня — 20 и 10 градусов, соответственно. Очевидно, что и в том и в другом случае мы можем определить, на сколько градусов температура летом выше, чем температура осенью. По шкале Цельсия эта разница составит 10 градусов для первой пары дней и столько же для другой пары. По шкале Фаренгейта для первой пары разница температур будет: 102,6-84,6 = 18 градусов, для второй пары: 93,6-75,6 = 18 градусов. Очевидно, что интервалы между сравниваемыми парами температур на шкале Фаренгейта также равны. Таким образом, сделав вполне допустимое линейное преобразование, мы не исказили имеющиеся интервальные отношения при измерении температур. Тем не менее интервальные измерения не позволяют оценивать отношения между шкальными значениями, т.е. измерять во сколько раз одно значение больше или меньше другого. Это ограничение является следствием условности нулевой точки на шкале.
Среди психологических измерений шкалы интервалов нередко встречаются в психодиагностике, кофа стандартизованные шкальные оценки выражены в единицах стандартного отклонения нормального распределения и нулевое значение на шкале соответствует нулевому отклонению от среднего выборочного распределения оценок испытуемых. Естественно, что на такой шкале нулевая точка и единица измерения условны и зависят от статистических особенностей конкретного выборочного распределения оценок испытуемых.
Шкала отношений. Эмпирические операции, соответствующие этой шкале включают не только эквивалентность, ранговый порядок, равенство интервалов, но и возможность определять на множестве эмпирических объектов равенство их отношений. Фактически шкала отношений есть собственно шкала интервалов с естественным или абсолютным нулем. Допустимыми преобразованиями на шкале отношений будут преобразования подобия (сжатия или растяжения), т.е. те, которые оставляют без изменений отношения (здесь — это частное от деления одного числа на другое) между числами. Хорошим примером возможности таких преобразований будет перевод сантиметров в дюймы, дюймов в футы и т.д. путем простого умножения шкальных значений на соответствующую константу.
По вопросу о введении на шкале естественной нулевой точки в литературе по теории измерения нет однозначной трактовки. Ряд авторов вполне справедливо отмечают относительность строгого различения абсолютной и условной нулевых точек на шкале. Эти понятия в большей степени детерминированы конкретными теоретическими построениями и принятыми в науке конвенциями.
Примерами шкал отношений в психологии могут служить психофизические шкалы прямых оценок, построенные в исследовательской традиции С. Стивенса.
Другие типы шкал. Рассмотренные типы, естественно, не исчерпывают списка всех возможных шкал. Например, следуя логике С. Стивенса, некоторые авторы выделяют так называемую шкалу разностей. Она отличается от шкалы интервалов тем, что на ней зафиксирована величина единицы измерения. Допустимым преобразованием для такой шкалы являются преобразования сдвига шкальных значений. Это преобразование смещает начальную точку на шкале, оставляя без изменений разности между числами.
Кроме того, классификация С. Стивенса далеко не единственная. Так, известный математический психолог К. Кумбс выделяет девять типов шкал, отличающихся друг от друга не только математической структурой операций на шкале, но и способами расчета расстояния между объектами шкал. В классификации не менее известного психолога У. Торгерсона выделяются два вида порядковых и два вида интервальных шкал, отличающихся между
Таблица 3
Основные типы шкал, используемых в психологических измерениях (по С.Стивенсу, [104])
Тип шкалы | Эмпирические отношения, устанавливаемые на шкале | Допустимые математические преобразования со шкальными значениями: х' =Лх) | Примеры шкал |
Шкала наименований | Отношения равенства (эквивалентности): =, * | Любое взаимнооднозначное преобразование | Результаты классификации: шкала основных цветов, номера телефонов |
Шкала порядка | Отношения порядка: > или < | Любая монотонно-возрастающая функция | Твердость минералов по шкале Мооса. Академическая успеваемость учащихся. Рейтинги популярности |
Шкала интервалов | Установление равенства интервалов или разностей | Линейное преобразование: х' = ах + Ь | Шкала температур (по Цельсию и Фаренгейту). Календарные даты. Стандартизованные оценки в тестах на достижение |
Шкала отношений | Установление равенства отношений | Умножение на константу: х' = ах | Длина, вес, плотность. Психофизические шкалы громкости, тяжести и т.д. |
собой наличием начала отсчета и возможностью задания расстояния на шкале [15].
Кроме того, в психологических и социологических исследованиях иногда используют абсолютные шкалы. Для абсолютных шкал единственным допустимым преобразованием является тождественное преобразование, т.е. такие преобразования, которые оставляют без изменения любые отношения между числами. Иначе говоря, с помощью абсолютных шкал мы получаем однозначно определенные значения, любая трансформация которых недопустима. Как отмечает И. Пфанцагль, иногда шкальные значения какого-либо измеряемого признака по абсолютной шкале получают с помощью так называемого императивного измерения [92]. Императивное измерение проводится в тех случаях, когда отсутствует подходящая процедура шкалирования, и возможен лишь неформальный подход. Как правило, такие измерения определяются какой-либо инструкцией или предписанием по приписыванию
чисел измеряемым объектам и не опираются ни на какое строгое отображение эмпирической системы в числовую. Основой для подобной инструкции может, например, быть согласованное мнение ведущих экспертов или какая-либо другая подобная конвенция. Использование абсолютных шкал объясняется их прогностической значимостью и практическим удобством, следовательно не претендует на установление строго формального соответствия между эмпирической и числовой системами.
Сведем в одну таблицу характеристики основных шкал по классификации С.Стивенса (табл. 3).