Проблемы измерения в психологии

Никогда нельзя быть уверенным, что измерение является безупречным. Любое измерение всегда включает истинное значение и ошибку измерения. Даже используя высокоточные измерительные приборы, исследователь не застрахован от ошибки, которая может быть допущена и самим человеком считывающим показания.

Существует ряд факторов снижения точности измерений, специфичных для психологических исследований. К ним относятся:

1. Сложность психологических феноменов (в частности, понятия интеллект, тревожность, депрессия имеют множество разных аспектов, и сложность заключается в том, что нужно обнаружить эти аспекты в одном числовом значении);

2. Реакции испытуемого, т.е. в отличие от измерений физических объектов, в психологических исследованиях сама процедура может искажать поведения обследуемого.

Например, на вес объекта не влияет процедура взвешивания, а при прохождении отбора на должность могут проявляться эффекты связанные с тревогой, социальной желательностью, симуляцией и т.п.)

3. Привнесения ожиданий и установок исследователей в собираемые данные. Такие эффекты сложно контролировать, поскольку они, как правило, носят не осознанный характер.

4. Использование составных баллов (как правило тесты включают серию вопросов связанных с измерением одного свойства, за каждый вопрос приписывается балл, а затем все баллы суммируются или комбинируются). Суммированный бал усложняет его использование и оценку этих баллов.

5. Чувствительность баллов - т.е. способность инструмента различать осмысленные количества или единицы измеряемого объекта.

Например: насколько мы сможем отследить состояние обследуемого в ходе психотерапевтической работы, если будем использовать две градации его состояния: плохое/хорошее? Или нам понадобиться 9 градаций?

Необходимо всегда подбирать единицы измерения соответствующие измеряемому свойству. В отличие от других наук, где данная проблема может быть решена до начала обследования, в психологии исследователь может не найти подходящей по чувствительности шкалы даже после проведения обследования.

6. Непонимание важности психометрической информации. Люди, проводящие тестирование, не всегда понимают, зачем они проводят тесты и как интерпретировать полученный результат.

Все измерения в психологии и методы, используемые для оценки тестовых баллов, основываются на способности находить психологические различия и давать их характеристику.

Цель измерения в психологии – обнаружить и оценить психологические различия, существующие между людьми во времени и в разных ситуациях.

Все измерения в психологии выполняются на определенной выборке.

Выборка или выборочная совокупность — множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании. Выборка должна быть репрезентативной.

Шкалирование

Психологическое измерение – это процесс приписывания чисел определенным количествам психологических качеств. По Стивенсу, измерение – это приписывание числовых форм объектам или события в соответствии с определенными правилами (Стивенс, 1946).

События – это обычно какие-то образцы индивидуального поведения.

Правила – шкалы измерения.

Шкалирование является фундаментальным вопросом измерения. В психологических исследованиях числа используются для представления уровня психологической характеристики, однако в зависимости от особенностей используемых чисел психологические свойства могут быть выражены разным образом.

Шкалирование – это особый способ, с помощью которого числа или символы связываются с наблюдениями поведения для создания измерительного инструмента (это широкое определение термина). По Стивенсу, шкалы измерений – это правила, в том смысле что они определяют каким образом свойства чисел или символов могут быть привязаны к наблюдениям поведения.

Цифрам присущ ряд свойств:

1. Свойство идентичности – это способность отражать «одинаковость» или «Различность». Самые простые измерения те, которые позволяют различать категории людей обладающих какой-то характеристикой. Люди должны обладать характеристикой, наличием которой они отличаются от другой группы. Объекты могут быть отнесены к категориям по сходству характеристик. Правила классификации категорий:

- Категории должны быть взаимоисключающими;

- Категории должны быть исчерпывающими;

- Поведение членов внутри категории должно удовлетворять свойству идентичности, т.е. люди должны быть идентичны по отношению к данному свойству.

На этом уровне числа служат меткой категории.

Например: мы может обозначить всех женщин в выборке буквой «ж», а может обозначить числом 0.

2. Свойство порядка – дает информацию об относительном количестве свойства, которым обладают изучаемые люди. Данное свойство отражает качественное различие в количестве характеристик. Здесь число отражает положение человека относительно других людей в рамках одного измерения. Числа для обозначения порядка тоже служат метками. Здесь главное, чтобы информация о значении категории была четко определена.

3. Свойство количества – отражает способность числа давать информацию о величине различий между людьми.

4. Число нуль – это число может иметь два значений. 0 может интерпретироваться как отсутствие свойства, либо означать какое-то произвольное количество (например, шкала температуры).

Шкалы измерений

Свойство числа Шкала
Наименований Порядка Интервалов Отношений
Идентичность х х х х
Порядок   х х х
Количество     х х
Абсолютный нуль       х
Пример Гендер Место на соревновании Температура Расстояние

Номинальная шкала. Переменные, измеренные в этой шкале, могут принимать одно из конечного числа неупорядоченных значений. Каждое из таких значений определяет отдельную категорию и может быть использовано как имя категории. Например, переменная - пол респондента - может принимать одно из двух значений - мужской или женский, тем самым, благодаря наличию этой переменной, мы можем разбить выборку на две категории и проводить их сравнительный статистический анализ.

К значениям номинальной шкалы не могут применяться никакие свойства чисел, такие как относительное значение, сложение или умножение. Соответственно и статистики, использующие предположение об упорядоченности и расстояниях между значениями, не имеют смысла для таких переменных.

Порядковая шкала -это упорядоченная номинальная шкала. Например, классификация работников на клерков, менеджеров и высшее руководство является порядковым разделением в плане меры ответственности каждого работника. Каждая категория находится в позиции выше или ниже по отношению к другой. Однако абсолютно неизвестно насколько выше - расстояние между категориями невозможно измерить. Упорядочение - единственная математическая операция, применимая к порядковой шкале.

Интервальная шкала, в добавление к упорядоченности дает информацию о расстоянии между значениями, например, при измерении температуры расстояние между 200С 210С такое же, как между 50С и 60С. Однако интервальная шкала не имеет определенной нулевой отметки, в разных системах измерения температуры ноль определен по-разному, и нельзя сказать, что 80оС в два раза горячее, чем 40оF.

Относительная шкала имеет все те свойства упорядоченности и расстояний, что и интервальная. В дополнение к этому определена точка отсчета (точка нуля). Например, это рост, вес, численность населения и т.д. Так как относительная шкала удовлетворяет всем требованиям системы вещественных чисел, к ней могут применяться любые математические операции. Однако нужно отметить, что существование нулевой точки редко является критичным при статистическом анализе и, зачастую, относительную шкалу не рассматривают как отдельную категорию, пользуясь интервальной шкалой.

Единицы измерения

Свойство количества требует, чтобы четко была определена единица измерения.

В психологических измерениях единицы измерения менее очевидны, чем в прочих исследования.

Свойство произвольности важно для понимания разницы между типами единиц измерений.

Первая форма произвольности - для некоторых единиц измерения сама величина единицы произвольна (можем использовать собственную меру, можем мерить в попугаях можем мерить в слониках).

Вторая форма произвольности - отсутствие связи между некоторыми единицами измерения и другими объектами (можем использовать попугаев для измерения всего, что имеет пространственное измерение: и длину удава, и высоту дома).

Третья форма произвольности – некоторые единицы измерения, облаченные в физическую форму, могут быть использованы для измерения разных свойств объектов (например, длины и веса).

В отличие от стандартных мер физических измерений в психологии единицы измерения привязаны к конкретным тестам и не являются произвольными.

Дисперсия

Одна из главных целей статистики состоит в осмысленном описании распределения тестовых балов.

Существует как минимум два типа различий, которые психологи стремятся измерить:

- межиндивидуальные различия – различия между людьми;

- индивидуальные различия – различия в поведении или личностных характеристиках одного и того же человека в разных обстоятельствах или в разное время.

Разнообразие (дисперсия) стоит в центре психологических исследований и практически всех исследований в науках о поведении.

Пример: Почему одни агрессивнее, общительней или умнее, чем другие?

Дисперсия – это количественный показатель разнообразия или индивидуальных различий в распределении тестовых баллов.

Стандартное отклонение – оценка среднеквадратического отклонения случайной величины x относительно её математического ожидания на основе несмещённой оценки ее дисперсии.

Ковариация – это степень соответствия дисперсий одного распределения и дисперсии другого распределения.

Меры центральной тенденциив статистике меры центральной тенденции служат для локализации множества значений вокруг одного единственного числа. При существующем многообразии мер центральной тенденции окончательный выбор меры всегда остается за исследователем. Мера центральной тенденции – это число характеризующее выборку по уровню выраженности измеряемого признака.

Арифметическое среднее (M или Х) – это значение, которое является «типичным» для распределения баллов, это сумма всех наблюденных значений, деленная на их количество

Взвешенное среднее – среднее значение, учитывающее весовые коэффициенты для каждого значения

Винсоризованное среднее – среднее арифметическое, при расчете которого все исключенные (в соответствии с установленным исследователем процентом) наибольшие и наименьшие значения заменяются на наибольшее и наименьшее "оставшиеся" значения соответственно

Гармоническое среднее – количество наблюдений, деленное на сумму инвертированных значений наблюдений

Геометрическое среднее – корень степени количества значений из общего произведения всех значений

Медиана (Me, Md, Median) — это такое значение признака, которое делит упорядо­ченное (ранжированное) множество данных пополам так, что одна половина всех значений оказывается меньше медианы, а другая — больше. Таким обра­зом, первым шагом при определении медианы является упорядочивание (ран­жирование) всех значений по возрастанию или убыванию. Далее медиана определяется следующим образом:

□ если данные содержат нечетное число значений (8, 9, 10, 13, 15), то ме­диана есть центральное значение, т. е. Md= 10;

□ если данные содержат четное число значений (5, 8, 9, 11), то медиана есть точка, лежащая посередине между двумя центральными значения­ми, т. е. Мd=(8+9)/2 = 8,5.

Мода (Mo) – это такое значение из множества измерений, которое встре­чается наиболее часто. Моде, или модальному интервалу признака, соответ­ствует наибольший подъем (вершина) графика распределения частот. Если график распределения частот имеет одну вершину, то такое распределение называется унимодальным.

Когда два соседних значения встречаются одинаково часто и чаще, чем любое другое значение, мода есть среднее этих двух значений.

Распределение может иметь и не одну моду. Когда все значения встреча­ются одинаково часто, принято считать, что такое распределение не имеет моды.

Бимодальное распределение имеет на графике распределения две вершины, даже если частоты для двух вершин не строго равны. В последнем случае вы­деляют большую и меньшую моду. Во всей группе может быть и несколько локальных вершин распределения частот. Тогда выделяют наибольшую моду и локальные моды.

Еще раз отметим, что мода — это значение признака, а не его частота.

Наши рекомендации