Локализация точки на шкале 11 страница
(17)
где i=1,2 ... , n
Таким образом, для минимизации ошибки необходимо просто взять среднее арифметическое по столбцу матрицы Z и мы получим оптимальное значение шкальной величины Si.
Рассмотрим практический пример решения V варианта закона сравнительных оценок методом наименьших квадратов (данные вымышлены). Испытуемому в случайном порядке предъявляются 6 цветных карт из малого набора теста Люшера и просят в каждой паре выбрать наиболее красивый. Каждая пара предъявляется по 50 раз. В итоге для одного из испытуемых была получена следующая матрица частот F (табл.1):
Таблица 1
Матрица частот F
Примечание. Элементом матрицы fi,jявляется частота, с которой в паре j,i стимул i оценивался более красивым, чем стимул j.
Полученная матрица частот F преобразуется в матрицу вероятностей P делением частоты fi,jна число предъявлений (N=50).
Таблица 2
Матрица вероятностей P
Примечание. Элементом матрицы pi,jявляется вероятность, с которой стимул i в паре j,i оценивался более красивым, чем стимул j.
Каждое значение вероятности pi,jиз матрицы P переводится далее с помощью таблицы в единицы стандартного отклонения нормальной кривой — zi,j, по которым и вычисляются шкальные значения Siкаждого стимула.
Таблица 3
Матрица Z ‑ оценок
Примечание. Элементом матрицы zi,jявляется вероятность pj,i, преобразованная в единицы стандартного отклонения.
Рассмотренная процедура дает возможность для каждого стимула Siполучить его значение на шкале интервалов.
§ 5. Процедура решения V варианта закона сравнительных суждений для неполной матрицы исходных данных
Реальные экспериментальные данные очень часто отличаются от той классической матрицы данных, которая анализировалась выше. Наиболее распространенный артефакт в процедуре парного сравнения, который связан с ограничением на возможное число предъявлений, — стопроцентное предпочтение одного стимула другому, что приводит к появлению в матрице вероятностей нулей и единиц. Ноль и единица в терминах модели Терcтоуна не несут сравнительной информации о различии стимулов, поэтому не могут быть использованы для расчетов шкальных значений стимулов.
Для матриц с нулями и единицами (они называются неполными матрицами) существуют особые алгоритмы анализа. Наиболее распространенный из них подробно описан в работе Торгерсона (1958) и вкратце состоит в следующем.
Из выражения (12) для стимула j следует, что стимул j+l будет описываться следующим выражением:
Sj+e - Si = zj,i+e . (18)
Вычтя из уравнения (18) уравнение (12), мы получим сравнительное различие для интересующего нас стимула косвенным путем. В терминах минимизированной ошибки эта величина может быть вычислена из выражения:
(19)
где nj— есть индекс суммирования.
Для практического удобства матрицу Z следует перестроить таким образом, чтобы столбцы были упорядочены по величине. Порядок столбцов в матрице Z определяется суммой по столбцу матрицы P. Для такой упорядоченной матрицы Z различие Sj+e - Siможно прямо вычислить из выражения (19). Если мы шкальное значение первого стимула (Si) приравняем к нулю, то шкальное значение любого стимула есть сумма шкального значения стимула и расстояния между данным стимулом и предшествующим:
S1= 0,
S2= d1,2 ,
S3 = S2+ d2,3 ,
Sn= Sn-1+dn-1,n . (20)
Рассмотрим практический пример решения для неполной матрицы частот, взятый из работы Торгерсона (1958). Пусть нам дана матрица вероятностей предпочтения i-го стимула j-му с некоторыми вырожденными (пустыми) элементами, равными 0 или 1.
Таблица 4
Матрица вероятностей P
Примечание. Элементом матрицы pi,jявляется вероятность, с которой стимул i в паре j,i оценивался более предпочтительным, чем стимул j.
Преобразуем вероятности pi,jв единицы стандартного отклонения нормального распределения — zi,j.
Таблица 5
Матрица Z — оценок
Примечание. Элементом матрицы Zi,jявляется вероятность pj,i, преобразованная в единицы стандартного отклонения.
Таблица 6
Матрица Z' — оценок
Примечание. Элементом матрицы Z ’i,jявляется вероятность p’j,i, преобразованная в единицы стандартного отклонения. . Столбцы упорядочены по возрастанию
Переставим столбцы в матрице Z в таком порядке, чтобы первый столбец имел наименьшую сумму элементов, а последний — наибольшую.
Из матрицы Z' можно получить матрицу различий между соседними парами столбцов, вычитая их поэлементно один из другого. В каждой j-й строке элемент этой матрицы будет равен ( zj,i+1- zj,i).
Пользуясь выражением (20), вычисляем из полученных различий шкальные значения стимулов, приняв, что S1= 0:
S1= 0,
S3 = 0 + 1.5 = 1.5,
S5= 1.5 + 0.53 = 2.03,
S4= 2.03 + 0.98 = 3.01,
S2= 3.01 + 0.56 = 3.97.
Из рассмотренной процедуры видно, что недостающие элементы матрицы компенсируются наличием внутренней связи между элементами столбца, что позволяет рассматривать разность между столбцами матрицы как результат алгебраической интерполяции отсутствующих элементов в столбце.
Таблица 7
Матрица разностей между столбцами
Литература
1. Терстуон Л.Л. Психофизический анализ // Проблемы и методы психофизики / Под ред. А.Г.Асмолова, М.Б.Михалевской. М.: Изд-во Моск. ун-та, 1974.
2. Guilford J. P. Psychometric Methods. N. Y., Toronto, London: Mc-Grow-Hill, 1954.
3. Torgerson N.S. Theory and Method of scaling. N. Y.: John Wiley and Sons, 1958.
Методические указания по выполнению учебного задания по теме “Метод парных сравнений”
Задание 1. Построение шкалы цветовых предпочтений методом парных сравнений
Цель задания: Освоить метод парных сравнений для построения шкалы интервалов. Сравнить построенную шкалу со шкалой порядка, полученную методом балльной оценки.
Методика
Аппаратура. Задание выполняется на IBM-совместимом персональном компьютере. Для предъявления сигнала “Внимание” используются головные телефоны, соединенные со звуковым синтезатором персонального компьютера. Для выполнения учебного задания используется компьютерная программа parcom.exe и mbe.exe1.
Стимуляция. На экране монитора предъявляются цветные прямоугольники из набора восьмицветного теста цветовых предпочтений Люшера: синий, зеленый, красный, желтый, фиолетовый, коричневый, черный и серый.
Процедура опыта. При отработке задания каждый студент выступает сначала в роли испытуемого, а затем обрабатывает собственные данные. Испытуемый сидит на расстоянии 1 м от экрана дисплея. Опыт состоит из 2-х серий.
В первой серии испытуемому предлагается оценить по 10-балльной шкале приятность каждого цвета. Для этого на экране монитора ему предъявляется вертикальная графическая шкала с десятью оценочными градациями от “невообразимо приятный — 10 баллов” до “невообразимо неприятный — 0 баллов” . Внизу экрана в случайном порядке расположены 8 цветных прямоугольников. Используя клавиши управления движением курсора <> и <®>, испытуемый может перемещать белую рамку от одного прямоугольника к другому и, таким образом, осуществлять свой выбор. Выбрав тот стимул, который нужно оценить, испытуемый нажимает на клавишу “Tab” и вводит нужное число от 0 до 10. Cправа от графической шкалы на соответствующем месте появляется прямоугольник того же цвета, а в нижнем ряду он исчезает. Действуя таким образом, испытуемый поочередно оценивает все 8 стимулов.
Во второй серии цветные прямоугольники предъявляются парами, и задача испытуемого заключается в том, чтобы оценить, какой из 2-х цветов ему нравится больше. Для ответа используются две клавиши управления движением курсора: <> (левый нравится больше) и <> (правый нравится больше). Как только испытуемый дает ответ, на экране появляется следующая пара стимулов. Всего предъявляются 144 пробы, т.е. все цвета встречается друг с другом по 6 раз. Три раза каждый из цветов предъявляется слева, три раза — справа. В верхнем правом углу экрана каждый раз высвечивается порядковый номер пробы.
Обработка результатов. После опыта студенту выдается компьютерная распечатка, в которой представлены: 1) по результатам первой серии — балльные оценки всех 8 цветов; 2) по результатам второй серии — усредненная по 6 предъявлениям матрица частот (F) — 8x8, элементом матрицы fi,jявляется частота, с которой в паре j,i стимул i оценивался более красивым, чем стимул j. При необходимости можно переписать на дискету файл с данными: его имя соответствует фамилии испытуемого, написанной латинскими буквами, а расширение — mpc.
Обработка результатов заключается в построении по каждой серии индивидуальной и групповой шкал1. По данным, полученным в первой серии, строится шкала порядка, по данным второй серии — шкала интервалов. Для получения групповых данных каждый испытуемый должен свести в таблицу и усреднить свои данные с данными других четырех испытуемых. Причем в академической группе студентов (как правило, 12 — 15 человек) не должно быть повторяющихся результатов.
Обсуждение результатов. При обсуждении полученных результатов каждый испытуемый должен сравнить расположение стимулов по шкале порядка и шкале интервалов и сделать заключение о преимуществах и недостатках каждого метода. Стоит подумать о метрических преимуществах шкалы интервалов, и об отражении в шкальных значениях более тонких особенностей сходства или различия между стимулами. Кроме того, необходимо дать сравнительную оценку индивидуальной и групповой шкал.
Следует также сопоставить исходные положения модели с полученными в эксперименте результатами и сделать выводы (сравнительно с другими методами) о преимуществах и недостатках метода парных сравнений.
Глава 3. МЕТОДЫ ПРЯМОЙ ОЦЕНКИ
Согласно наиболее распространенной точке зрения группу методов, которые позволяют получить количественную оценку психологической величины на шкале интервалов или отношений как непосредственный результат измерительной процедуры, называют методами прямого шкалирования. Прямое шкалирование базируется на предположении о наличии у человека внутренней шкалы измеряемого психологического признака, имеющей начальную точку и единицу измерения, и, следовательно, способности выносить количественные суждения относительно своих ощущений. Другие, рассмотренные выше методы одномерного шкалирования (методы балльных оценок и парных сравнений), являются прямыми только для порядковой шкалы. Шкалы более высокого порядка могут быть построены при использовании этих методов только в случае введения дополнительных теоретических допущений, например, допущение о нормальном характере распределения измеряемого признака дает возможность получить вместо порядкового измерение на шкале интервалов.
Другой смысл названия прямого шкалирования состоит в том, что им подчеркивается простота, наиболее короткий путь от измерительной процедуры, в которой исследователь получает “сырые” данные, до построения субъективной шкалы, поскольку шкальное значение измеряемого психологического признака выражено в содержании ответа испытуемого. Конструирование шкал интервалов или отношений с помощью непрямых методов (косвенное шкалирование) требует помимо дополнительных теоретических допущений еще и ряда статистических манипуляций, т.е. осуществляется более опосредованным и трудоемким путем.
Во всех методах прямого шкалирования используются два типа организации ответных реакций испытуемого в ходе измерения: процедура оценки, когда от испытуемого требуется только сообщать свои суждения о предъявляемых ему объектах, и процедура воспроизведения, с помощью которой экспериментатор узнает о субъективных оценках испытуемого по тому, как он воспроизводит заданные величины, интервалы или ощущения, регулируя величину измеряемого параметра объекта.
К числу прямых методов, приводящих к интервальной шкале, относится метод кажущихся равными интервалов (другое его название – метод категориальной оценки), метод последовательных интервалов и метод равных сенсорных расстояний (иначе он называется методом воспроизведения категорий).
Шкала отношений может быть получена непосредственно из результатов измерения при использовании метода оценки отношений, метода постоянных сумм, метода установления заданного отношения (фракционирование и мультипликация), метода оценки величины и метода воспроизведения заданной величины.
Заслуга введения этих методов в широкую практику психологических измерений принадлежит С.С. Стивенсу. Ниже будут подробно рассмотрены два метода из перечисленных выше – метод установления заданного отношения и метод оценки величины.
§ 1. Метод установления заданного отношения
1. Модификации метода установления заданного отношения.
Известны две модификации метода установления заданного отношения: метод фракционирования (деления) и метод мультипликации (умножения). В методе фракционирования (деления) испытуемому предъявляют поочередно несколько стандартных стимулов (Sst) и просят подобрать к каждому из них среди предъявляемых ему на сравнение стимулов (Sc) такие, величины которых составляют заданную часть от соответствующих Sst. Обычно задаются простые дроби типа 1/n = 1/2, 1/3 и т.п. Чаще всего используется 1/n = 1/2, т.е. “деление пополам”. При подборе стимула, находящегося в заданном отношении к Sst, используются процедуры оценки или воспроизведения.
Метод мультипликации (умножения) отличается от фракционирования только тем, что испытуемый должен подбирать к стандартному стимулу такой, который превышает его в заданное число раз, т.е. n>1.
2. Требования к шкалируемому признаку.
Методы фракционирования и мультипликации могут применяться для шкалирования только в том случае, когда шкалируемый признак удовлетворяет двум условиям:
1. Испытуемый должен иметь возможность наблюдать изменение переменного стимула, с помощью которого он подбирает заданное отношение, как непрерывное или с очень малым шагом. В противном случае он не сможет точно установить заданное отношение.
2. Субъективному шкалируемому признаку должна соответствовать физическая шкала стимулов, поскольку построение субъективной шкалы данным методом возможно только через определение психофизической функции, связывающей величины ощущений со стимульными значениями. Дело в том, что методом установления заданного отношения можно измерить (т.е. сопоставить со шкальными значениями одной и той же шкалы отношений) ощущения, вызванные не всеми, а только некоторыми стимулами (Sst). Например, если заданное отношение равно 1/n, то однозначно могут быть определены шкальные значения ощущений, вызванных только стимулами, равными na, где a = ± 1,2,3,...,n. Если 1/n = 1/2, то в эксперименте можно получить только следующие шкальные значения: 1/16, 1/8, 1/4, 1/2, 1, 2, 4, 8, 16 ... Но для любого шкального значения, лежащего между соседними, вызванными стимулами naи na+1, в общем случае нельзя однозначно указать соответствующий ему стимул. Им может быть любой стимул, лежащий между naи na+1, и определить его можно только при наличии психофизической функции.
Процесс определения психофизической функции состоит из нескольких этапов:
1. Получение в процедуре измерения оценок стимулов, находящихся в заданном отношении к стандартным стимулам.
2. Проведение регрессионного анализа полученных данных, построение графика деления (умножения) на n и психофизической зависимости.
3. Проверка выполнения свойств шкалы отношений.
4. Определение вида психофизической зависимости.
Рассмотрим последовательно каждый из этих этапов на примере работы (Харпер, Стивенс, 1948) по взвешиванию грузов.
3. Организация измерительной процедуры.
При измерении оценок стимулов, находящихся в заданном к стандартным стимулам отношении, используется какой-либо из методов определения локализации точки на оси (методы границ, констант или подравнивания). Процедуры этих методов минимизируют возможность систематических ошибок в оценке. Выбранный психофизический метод задает порядок предъявления переменных стимулов (Sc), среди которых нужно выбрать находящийся в заданном отношении к стандартному, и способ вычисления средней оценки, поскольку всегда имеет место разброс оценок, получаемых в отдельных пробах и у разных испытуемых.
Сравниваемые стимулы выбираются так, чтобы охватить весь возможный диапазон разброса оценок при подборе стимула, находящегося в заданном отношении к стандарту, и обеспечить хорошую точность оценки, т.е. они изменяются малыми шагами. Они предъявляются либо рандомизированно (метод констант), либо восходящими и нисходящими рядами (метод подравнивания). Средняя оценка вычисляется как точка субъективного равенства (PSE). Число измерений на каждую PSE может быть уменьшено при хорошей “кучности” оценок. Обычно их число лежит в пределах от 30 до 100 на точку.
Стандартные стимулы выбираются так, чтобы охватить всю область измеряемого признака, а их число должно быть таково, чтобы обеспечить выявление разрывов психофизической функции, если они есть, и проведение гладкой кривой, если их нет. Как правило, используется не менее 5 стандартных стимулов. Обычно величины стандартных стимулов выбираются так, чтобы составить геометрический ряд, поскольку психофизическая зависимость чаще всего нелинейна.
Повторные оценки могут быть получены при опросе группы испытуемых, при повторном опросе одного испытуемого, а также обоими этими способами в зависимости от того, хотим мы получить эту шкалу для одного испытуемого или группы испытуемых. При повторном опросе одного испытуемого возникает вопрос, получать ли сразу несколько оценок для одного стандартного стимула, а затем переходить к следующему, или же получать одну оценку каждого из стандартных стимулов, а затем повторять всю серию. Наиболее предпочтительным с точки зрения независимости оценок является второй способ, который, однако, может оказаться более трудным для испытуемого.
Следует принять во внимание такой фактор, как тренированность испытуемых. Тренировка может уменьшить разброс оценок, т.е. увеличить их надежность, но вместе с тем процесс тренировки может изменить вид психофизической функции. Более того, различные способы тренировки могут привести к различным изменениям функции. Решение, тренировать ли испытуемых, зависит от того, как будет использоваться построенная шкала. Например, если в дальнейшем она будет применяться в работе с нетренированными испытуемыми, то не следует проводить их тренировки.
Предотвращение систематических ошибок и смещений, обусловленных внешними факторами.
Причины смещений могут быть самыми разнообразными. Два хорошо известных примера — фиксированный временной или пространственный порядок предъявления переменного и стандартного стимулов приводит к появлению систематических смещений. Эти ошибки могут быть предотвращены посредством уравновешивающих процедур, предусмотренных в традиционных пороговых методах.
Несколько сложнее контролировать влияние так называемых контекстных эффектов. Многие исследования показали, что когда испытуемому предъявляют ряд переменных стимулов, он пытается выбрать как соответствующий заданному отношению со стандартом тот из стимулов, который расположен около середины ряда. Этот факт хорошо объясняется теорией уровня адаптации Хелсона. Влияние набора стимулов на суждение особенно сильно в тех случаях, когда оценка затруднительна для испытуемого. Гарнер (1954) показал, что выбор стимула, оцениваемого как половина стандарта, полностью зависит от используемого диапазона переменных стимулов. Гилфорд (1954) советует для полного устранения этого эффекта использовать один длинный ряд переменных стимулов для всех стандартных. Данные Стивенса и Поултона (1956) подтверждают, что контекстные эффекты исчезают, когда испытуемого не ограничивают фиксированным рядом сравниваемых стимулов, например, при использовании процедуры подравнивания.
Ниже приводится ряд стандартных стимулов весов, использовавшихся в работе Харпера и Стивенса (1948) и соответствующие им медианы (Md) весов, оцененных испытуемыми как равные половине стандартных (табл. 1).
Таблица 1
Результаты оценки испытуемыми стимула как половины стандартного (по Харперу и Стивенсу, 1948)
4. Построение графика деления (умножения) на nи психофизической функции.Средняя оценка стимулов, находящихся в заданном отношении n со стандартом, вычисляется либо как медиана Md, которая является грубой, но просто вычисляемой оценкой, либо как среднее геометрическое G, определяемое по формуле:
(1)
где, S1... Sn— величины стимулов, оцененных как составляющие заданную часть от стандартного; n — число повторных оценок .
Если число оценок больше трех, то G удобнее находить путем логарифмирования:
. (2)
Харпер и Стивенс воспользовались, как уже было сказано выше, медианой для оценки весов, воспринимаемых как половина стандартного. На основании полученных данных была определена зависимость S’= f(Sst), где S’– медиана стимулов, оцениваемых как половина стандартного стимула. Эта зависимость представлена на рис. 1.
Рис. 1. График “деления на 2”: по оси абсцисс – веса стандартного стимула (Sst), в граммах; по оси ординат – веса, воспринимаемые как половина от стандартных (S'), в граммах. Обе оси взяты в логарифмическом масштабе из-за большого диапазона значений стимулов. По экспериментальным точкам проведена регрессионная прямая (по Харперу и Стивенсу, 1948)
В данном случае экспериментальные точки почти точно ложатся на прямую, и она без явных ошибок может быть проведена на глазок.
Обычно линия, сопоставляющая на графике деления на n каждому стандартному стимулу Sstстимул S', воспринимаемый как объективно в n раз меньший, проводится через конечное и, как правило, небольшое число точек, соответствующих использованным стандартным стимулам. Проведение плавной линии через несколько точек, разумеется, всегда содержит ошибку, неточность. Однако, если вид зависимости известен (линейная, логарифмическая и т.п.), то неточность по отношению к экспериментальным точкам можно минимизировать. Минимизация ошибки является задачей регрессионного анализа, а полученная в результате решения этой задачи линия называется линией регрессии (прямолинейной, логарифмической и т.п.). Пока мы можем забыть о допускаемой неточности в определении этой кривой и рассматривать ее как непрерывную и “точную” для всех S.
Как от графика деления на n, который является только стимульно-стимульной функцией, перейти к психофизической функции? Для этого нужно только ввести единицу измерения на субъективной шкале, поскольку все нужные для построения субъективной шкалы соотношения субъективных и стимульных значений уже содержатся в полученной в опыте зависимости: S' = f(Sst). Для этого выбирается какой-либо из стандартных стимулов и соответствующее ему значение на шкале ощущения (Z) принимается за единицу (Z=1). Харпер и Стивенс выбрали в качестве такового ощущение тяжести, возникающее при поднятии груза 100 г., и назвали эту единицу “вег” (от старонорвежского слова, имеющего значение “поднимать”). Естественно, что шкальное значение того веса, который испытуемый оценил как вдвое менее тяжелый, чем Sst= 100 г, равно 1/2 вега. Это вес 77 г. В принципе метод установления заданного отношения позволяет указать любой стимул, которому соответствует шкальное значение, равное na, где а = 0, ±1, ±2 .... В нашем примере, где 1/n = 1/2, можно найти значения 1/4, 1/8, 1/16, 2, 4, 8, 16 и т.д. Как это делается, показано на рис. 2.
Рис. 2. Пример построения психофизической функции: по оси абсцисс – вес стандартного стимула, в граммах; по оси ординат – шкальные значения тяжести (Z).
Примем, что шкальное значение, соответствующее стимулу S1, равно 1. Таким образом, мы вводим единицу измерения на будущей шкале (в нашем примере — это 1 “вег”) и строим на ней первую точку с координатами (100; 1 или S1; S’1 на рис. 2). Тогда стимулу S0, оцененному как в n раз меньший, соответствует шкальное значение 1/n. Отложив по оси абсцисс значение S0 (мы его находим без труда из графика “деления на n”, приведенного на рис.1, т.к. в опыте уже найден тот вес, который ощущается как половина от S1), соотносим его со шкальным значением 1/n и строим на графике вторую точку. В нашем примере шкальное значение S’0 будет равно 1/2. Так можно найти и все дальнейшие отрицательные степени n. Естественно, что точность построения психофизической функции будет зависеть от точности вычислений стимульных значений по графику “деления на n”, что, в свою очередь, определяется “хорошестью” подгонки экспериментальных точек под плавную кривую или прямую, отражающую устойчивость полученной эмпирической зависимости. Чтобы получить все положительные степени того же отношения, необходимо изменить направление наших расчетов. Найдем по графику “деления на n” величину стимула, который при делении на n дает 1 вег — S’2. Эту величину можно найти, проведя перпендикуляр от той точки на оси ординат, которая соответствует 1 вегу, до пресечения с аппроксимирующей кривой (прямой), и из точки пересечения опустить перпендикуляр на абсциссу. Найденная величина (S2) соответствует n вегам (в нашем примере n = 2) и может, в свою очередь, быть использована для определения 2n вегов и т.д.
По найденным парам значений на субъективной шкале (Z) и на физической шкале стимулов (S) строится психофизическая функция: по оси абсцисс откладываются субъективные величины (например, веги), а по оси ординат — соответствующие им значения физического параметра стимула (например, граммы). Плавная линия, соединяющая точки, образованные парами значений Z и S, и образует графическую шкалу ощущений тяжести. Эта линия может быть проведена “на глазок” или с использованием методов регрессионного анализа и аппроксимирована подходящей математической функцией.
В дальнейшем психофизическая зависимость может использоваться для определения шкальных значений любого стимула, в том числе и такого, который не применяется в опыте, например, лежащего между S’1и S’2. В самом деле, такому стимулу нельзя приписать однозначно шкальное значение, поскольку к нему нельзя “прийти” от предъявлявшихся в эксперименте стимулов S1или S2путем описанной выше процедуры с помощью кривой “деления на n”. Можно только утверждать, что его шкальное значение лежит между 1/n и 1. Это утверждение будет справедливо лишь при допущении, что психофизическая зависимость является строго монотонной. Неточность в определении шкального значения, соответствующего этому стимулу, возрастает за счет ошибки при построении психофизической зависимости.