Объективность психологического измерения
В практике психологической работы основной целью является верное, независимое от мнения психолога выявление величины исследуемых признаков, психолог стремится объективно оценить психическую ситуацию, особенности личности испытуемых. Это может быть достигнуто путем многократного применения различных методов, длительного наблюдения за проявлениями признаков различными субъектами, а также путем выявления высокочастотной вероятности их оценки в различных или типовых ситуациях.
Таким образом, объективность в психологическом исследовании — это адекватность и независимость результант оценки качеств или свойств изучаемого объекта или явления от субъективности исследователя. Она может быть достиг нута путем абстрагирования психолога от индивидуальности интерпретации результатов исследования, когда складывается ситуация, в которой признак определенно и однозначновыявляется у большинства испытуемых разными исследователями. Однако опыт психолога позволяет интуитивно или на основе накопленных фактов и сформулированного алгоритма отсекать незначимую, необъективную информацию, тем самым объективизируя свой субъективный вывод.
Таким образом, объективность психологического исследования вообще и эмпирических показателей в частности достигается путем приобретения опыта получения, использования и интерпретации данных, а также неуклонного соблюдения критериев достоверности психологического измерения.
Опыт психолога как показатель объективности психологического исследования проявляется, по крайней мере, в трех аспектах. Во-первых, с течением времени исследователь сравнивает результаты субъективной оценки с объективными результатами жизнедеятельности испытуемых. Причем накопленный эмпирический результат в этом сопоставлении приобретает свою объективность, так как экспериментальная оценка «редактируется» и корректируется, становясь реальной и объективной. Во-вторых, исследователь корректирует и сам инструмент исследования. «Отсекаются» незначимые показатели и шкалы, изменяется их интерпретация, разрабатываются новые нормы и критерии оценки. В-третьих, в процессе психологической практики исследователь усваивает чужой опыт через публикации и в ходе непосредственного обмена информацией. Эти факты иллюстрируют переход субъективной психологической оценки психолога в русло объективного вывода.
Под достоверностью следует понимать «достаточную верность» измерений, т.е. достаточную для данного уровня психологических представлений правильность (истинность) результатов. Допустимая ошибка не должна превышать степень предположения о действительной величине признака. Таким образом, достоверность может складываться из точности измерений и адекватности оценки реально исследуемого признака.
На практике достоверность психологического измерения определяется, прежде всего, валидностью (соответствием тестовых данных измеряемому свойству), надежностью (точностью психодиагностических измерений), прогностичностью (предположение о развитии измеренного свойства) и нормативностью применяющихся психологических методик.
Валидность психологических методов.Проблеме валидности в психологии посвящено довольно много исследований. Причем классификация видов и типов валидности и их наименования приводятся довольно разнопланово (рис. 4.10).
Рис. 4.10.Структура валидности методов и средств психологического исследования
Валидностью как элементом достоверности психологического измерения свойств психологического явления называется мера соответствия эмпирических оценок представлениям о сущности свойств или их роли в том или ином исследуемом явлении. В теории психометрии определяют два основных типа и несколько видов валидности методов. К типам валидности относятся: внешняя и внутренняя валидность.
Внешняя валидностъ — это мера возможности распространения результатов измерения на исследуемую популяцию. Она определяется путем формирования репрезентативной исследуемой выборки и перекрестной валидизации.
Репрезентативность выборки — это представительность .1Ксперименталыюй выборки, отражающая основные свойства исследуемой популяции (генеральной совокупности). Она определяется путем сопоставления качественных и количественных характеристик экспериментальной выборки с характеристиками популяции с целью установления их однородности. К качественным характеристикам могут быть отнесены социально-демографические, видовые, интеллектуальные (образовательные), профессиональные и другие характеристики популяции (группы), которые являются предметом исследования или существенно влияют па него. Количественная характеристика экспериментальной группы — это минимальная ее численность, которая сохраняет свойства генеральной совокупности. В психологической литературе существует несколько теоретических подходов к расчету объема минимальной репрезентативной выборки, часто приводятся таблицы опытно полученных данных.
Перекрестная валидизация производится путем апробации методики на выборке, отличной от экспериментальном, с целью определения границ ее применимости по критерию «характеристика популяции» (для определения уровня развития свойства у детей, подростков, мужчин или женщин, определенной группы специалистов и т.д.). В ходе перс крестной валидизации рассчитываются коэффициенты корреляции между показателями, полученные в результате тестирования разных групп испытуемых. Вывод о возможности применения методики на конкретной популяции делается при помощи определенных статистических критерием.
Внутренняя валидность — мера соответствия тесто вых оценок уровню развития измеряемого свойства. Она состоит, по крайней мере, из пяти видов элементов: а) концептуальной (теоретической) валидности (теоретические обоснование возможности измерения исследуемого свойства данным психологическим средством); б) содержатель ной валидности (степень репрезентативности содержании задний методики измеряемой области психических свойств,
в) конструктной валидности (степень представленное'!'!! исследуемого психологического конструкта в результатах измерительного средства («насколько результаты теста рассматриваются в качестве меры исследуемого психологического конструкта — фактора, свойства»1)); г) операционной валидности (степень представленное™ в экспериментальных операциях реальных операционных условий психической реальности); д) эмпирической валидности (совокупность характеристик валидности методики, полученная сравни тельным статистическим способом оценивания. К этим характеристикам относятся так называемая аутовалидностиочевидная, критериальная и др. виды валидности. Эмпирическая валидность измеряется при помощи коэффициентом валидности).
Прогностическая валидностъ является элементом содержания достоверности метода и определяется как степеньточности и обоснованности суждения об исследуемом психическом свойстве по его результату, спустя определенное время после измерения.
Показателем прогностичности является степень регрессии тестовых данных к объективным критериям. Регрессияпредставляет собой функцию f(х1, х2 Х3,... хп), описывающую зависимость среднего показателя методики, измеряющей некоторое психологическое явление, от заданных фиксированных значений реального проявления этого явления (внешнего критерия — у). Эта функция может иметь линейный и нелинейный вид.
В практической психологии для прогноза развития или проявления измеренного свойства чаще применяют линейную или множественную линейную регрессию (у — b + а1х1+ а2х2 + ..., + аnхn). Физический смысл ее заключается в приравнивании зависимой и независимой переменных. Изменение независимой переменной определяет соответствующую флуктуацию зависимой переменной. Коэффициенты уравнения отражают степень прогностичности функции, т.е. уровень объясняемой дисперсии «х» за счет изменения «у». При использовании тестовой батареи прогноз измеряемого свойства осуществляется посредством связанных между собой нескольких зависимых переменных (Х1, х2, х3, ..., хn), которые и формируют множественную линейную регрессию. При использовании множественной линейной функции для прогноза развития исследуемого явления или свойства повышается уровень прогностичности измерения и его достоверности за счет перекрытия разными методиками различных сторон исследуемого явления или свойства.
Надежность — это характеристика психологической методики, отражающая точность измерений, а также устойчивость (стабильность) результатов к действию посторонних случайных факторов1. Надежность и валидность являются важнейшими характеристиками методики как инструмента психологического исследования.
Наибольшая стабильность результатов наблюдается при применении графических и графологических тестов, показатели которых меняются крайне медленно. Медленно изменяется почерк, а также остаются практически неизменными качество линий рисунков и их композиция. Наибольшая динамичность показателей наблюдается у интеллектуальных тестов, которые напрямую зависят от способности человека накапливать и перерабатывать информацию.
На устойчивость (стабильность) показателей метода влияют: состояние и настроение обследуемых, мотивация испытуемых на тестирование, эргономические факторы
(освещенность, температура в помещении, вибрация, шумы и пр.), характеристика деятельности (монотонность — динамичность, помехи и т.д.), степень обучаемости (или натренированности) испытуемых, изменчивость инструмента психологического измерения, стабильность самой процедуры измерения и др. Надежность, таким образом, есть степень согласованности результатов тестирования, получаемых при первом и последующих измерениях.
На практике наиболее широко применяется шесть типов надежности: надежность ретестовая (тест-ретест надежность); надежность параллельных форм; надежности частей теста (надежность как гомогенность тестов); надежность по Кудеру — Ричардсону; надежность интерпретатор;! («оценщика») и стандартная ошибка измерений.
Определение коэффициента надежности первых двух типов вычисляется но формулам расчетов коэффициентом корреляции (в зависимости от шкалы, в которой измерены данные) межу первым и последующим измерениями или между параллельными формами методики.
Расчет коэффициента надежности при исследовании гомогенности осуществляется путем разбиения методики на равные субтесты и расчета корреляции между этими частями. Для определения общей надежности метода полученные коэффициенты корреляции вводятся в формулу Спирмена — Брауна:
где R — корреляция «половин» теста.
Если части методики являются отдельными дихотомическими заданиями, например, вопросами, на которые может быть дано два ответа (да или нет), или заданиями с оценкой результата как правильного, так и неправильного, используется формула
Rxxx= (К/К-1)x(1-1 ∑(piqi),
где р( — доля первого варианта ответа на вопрос 1; ^^ — доля второго варианта на вопрос 1.
Надежность частей методики также может рассчитываться по формуле Кудера — Ричардсона:
где К — количество равных частей
При работе с клиническими опросниками, тестами креативности и проективными технологиями надежность методик определяется путем сравнения интерпретаций результатов двумя или более экспертами-психологами. Значимые коэффициенты корреляции между ними показывают надежность экспертизы.
Коэффициенты надежности психологических измерений представляют собой величину дисперсии показателей, которая вычисляется путем возведения коэффициента корреляции в квадрат. Интерпретируется он следующим образом. например, коэффициент корреляции между параллельными формами методики равен 0,75. Коэффициент надежности рассчитывается как 0,752 = 0,56. Это означает, что 56% дисперсии исследуемых эмпирических данных зависят от истинной дисперсии признаков (данных параллельного теста), а 44% — от ошибок или случайных переменных.
Надежность можно выразить посредством расчета стандартной ошибки измерений (5ЕМ) (стандартная ошибка показателя), которая рассчитывается по формуле
где xстандартное отклонение показателей теста, а Rхх — значение коэффициента надежности.
Физический смысл 5ЕМ заключается в определении дисперсии показателей методики вокруг «истинного показателя», которая характеризуется плотностью нормального распределения данных. Если, например, 68% всех случаев нормального распределения психологических данных попадает в интервал Мх ±xто примерно два шанса против одного (68 / 32), что ошибка измерений будет «колебаться» в пределах ± 1SЕМ. При увеличении плотности распределения данных, например, Мх ± 3SЕМ, увеличивается и вероятность предсказания (99,7 / 0,3) при соответствующем росте интервала ошибки в обе стороны1.
Таким образом, надежность, валидность и прогностичность эмпирических данных дают возможность измерять психологические переменные на соответствующем уровне достоверности, который диктуется практикой социальных исследований.