Проблемы измерения в психолого-педагогических исследованиях
Соответствие величин, с которыми оперирует модель, реальным количественным характеристикам описываемых явлений и объектов составляет первое, решающее условие состоятельности любого количественного исследования. Качественная природа этих величин устанавливается на основе содержательного психолого-педагогического анализа соответствующих аспектов процессов обучения и воспитания. Количественное же (числовое) их определение достигается с помощью операции измерения.
Измерение заключается в обозначении величин, рассматриваемых как аргументы, определенными числами, рассматриваемыми как функции, по правилам, обеспечивающим аддитивность этих функций.
Отображение в числовой системе, образующейся при измерении, тех или иных структурных свойств, присущих изучаемым объектам, достигается подбором соответствующей шкалы измерений, т.е. правил приписывании числовых форм определенным сторонам объектов и явлений.
Конструирование такой адекватной шкалы измерений обеспечивается учетом следующих двух требований: 1. Эмпирическая операция, лежащая в основе измерения, должна быть выполнима в изучаемой системе объектов. 2. Формальная операция, репрезентирующая ее в числовой модели, должна быть выполнима в избранной числовой системе.
Основными операциями, при помощи которых это может быть достигнуто, являются: а) регистрация и подсчет числа объектов с данным признаком (репрезентируется номинальной шкалой), б) упорядочение объектов по сравнительной величине (рангу) определенного признака (репрезентируется ординальной шкалой); в) сопоставление величины исследуемого признака с определенным стандартным интервалом, принятым за единицу меры (репрезентируется интервальной шкалой); г) соотнесение величины исследуемого признака с интервалом физически возможных его вариаций (репрезентируется рациональной шкалой).
Допустимость использования того или иного из перечисленных видов измерения определяется возможностью выполнения при его производстве определенных условий, которые обеспечивают удовлетворение сформулированных выше требований. Для регистрирующего измерения – это наличие критерия, позволяющего однозначно отличать объекты, относящиеся к исследуемому классу, от всех остальных. При упорядочивающем измерении к этому условию добавляется требование о наличии критерия, позволяющего однозначно отличить большую величину признака от меньшей, а также – возможность по парного сравнения всех исследуемых объектов по указанному критерию. Для интервального измерения необходимы: стандартный эталон меры, возможность сопоставления его величины с измеряемой величиной, достаточная стабильность эталона и сопоставимость применяемых в разных случаях единиц меры. Наконец, для построения рациональной шкалы дополнительно необходимо наличие истинной нулевой точки отсчета.
Числовые данные, полученные при использовании различных видов измерения, имеют совершенно различный смысл, и, как правило, требуют применения различных статистик. Так, для обработки результатов регистрирующих измерений применимы методы статистики событий и дискретной математики. Для результатов упорядочивающего измерения – методы статистики рангов и качественных признаков. Для интервального и пропорционального – статистика случайных величин и методы математического анализа.
Главные трудности, которые возникают в этой области, связаны со специфическими особенностями многих величин, характеризующих педагогические и психолого-педагогические процессы, В них, как правило, участвуют два вида переменных: а) переменные, непосредственно ненаблюдаемые и неизмеримые – к ним относятся, главным образом, величины, характеризующие внутренние свойства психических явлений и процессов у учащихся; б) переменные, наблюдаемые, но непосредственно неизмеримые – к ним относятся, главным образом, величины, характеризующие некоторые качественные свойства материальных объектов и действий, влияющие на протекание психических процессов у учащихся (например, степень трудности учебного материала, эффективность воспитательного приема и т.п.).
Преодоление указанных трудностей может быть частично достигнуто Применением соответствующих специальных видов измерения. В частности, препятствия, связанные с непосредственной ненаблюдаемостью некоторых психических величин, можно обойти, применяя методы косвенного измерения, т.е. наблюдая и измеряя другие – наблюдаемые – величины (индиканты), известным образом связанные с излучаемыми ненаблюдаемыми переменными (коррелатами). Препятствия, связанные с неизмеримостью многих качественных переменных, могут быть частично преодолены путем использования некоторых видов без масштабного измерения, например, регистрации или упорядочения, для которых не требуется количественно определенной единицы меры.
Однако использование указанных способов измерения ставит в свою очередь, ряд существенных проблем: 1. Как определить связь, существующую между индикантами и измеряемыми через них ненаблюдаемыми переменными? 2. Как обеспечить применительно к этим ненаблюдаемым переменным условия выполнимости регистрирующего и упорядочивающего измерения 3. Как отобразить результаты таких без масштабных измерений на шкала коррелирующих с ними относительных или пропорциональных изменений индикантов?
Три различных ответа на эти три коренных вопроса связаны с тремя разными подходами к измерению психолого-педагогических свойств и явлений, имеющими ныне место в психологии и педагогике а) психофизическим, основы которого были заложены работами Г. Фехнера; б) феноменологическим, возникновение которого датируют исследованиями Г. Эббингауза и в) психометрическим, создание которого связано с именем Ф. Гальтона.
Общим для всех этих направлений является то, что в качестве инструмента дли регистрации или упорядочения исследуемых непосредственно неизмеримых (и ненаблюдаемых) факторов психической деятельности человека используется сам человек. Параллельно измеряются определенные наблюдаемые объективные свойства воздействующих стимулов (заданий) или полученных реакций (ответов) или те и другие вместе. Переход от без масштабной меры исследуемого психического свойства (процесса) к масштабной осуществляется путем изоморфного отображения полученных систем объективных величин на предположительно коррелирующие с ними психические переменные.
Различие рассматриваемых методик заключается в том, что при психофизических измерениях регистрируются и сопоставляются с изменениями стимула результаты непосредственных наблюдений испытуемого за собственными ощущениями или иными психическими процессами. При феноменологических же и психометрических измерениях регистрируются и сопоставляются со стимулом только объективные, внешние реакции испытуемого в ходе выполнения определенных заданий. Измеряемыми параметрами при психофизической методике являются физические свойства стимула (интенсивность, длительность, сила и т.д.); при феноменологической и психометрической – достижения испытуемого (количество правильных ответов, число ошибок и т.д.).
В свою очередь, различие между феноменологическим и психометрическим подходом связано с интерпретацией, которая дается реально наблюдаемым вариациям реакций у различных испытуемых в тождественных ситуациях.
При феноменологическом (и психофизическом) подходе указанные ~- вариации рассматриваются как «ошибки измерения» или же «ошибки природы». Соответственно вводится статистическое понятие «нормального» человека, которому приписываются некие устанавливаемые «истинные» величины тех или иных психических и психофизических свойств. А любые иные их значения, наблюдаемые у людей, рассматриваются как случайные «уклонения от нормы».
Это позволяет использовать функцию нормального распределения («гауссову кривую») как характеристику уклонений от нормы, возможных у разных людей. Приняв такую гипотезу, можно с помощью известных статистических методов оценивать достоверность средних значений, полученных в опыте, вероятность их совпадения с «истинным» значением измеряемой величины и т.п. Короче, становится возможным применять в психолого-педагогических исследованиях всю статистическую технику, используемую для обработки результатов физических измерений, их очистки от случайных ошибок, выявления наиболее вероятного истинного значения измеряемой величины и т.д. Критерием адекватности индиканта служит здесь инвариантность его среднего значения для тождественных стимулов при достаточно широком варьировании испытываемых индивидов.
При психометрическом подходе измеряемой величиной являются, наоборот, именно значения индивидуальных вариаций тех или иных психических свойств у отдельных людей. А задачей измерения – установление определенной ранговой шкалы оценок испытуемых с точки зрения степени развития у них этих свойств. Критерием адекватности индиканта служат здесь инвариантность его среднего значения у того же индивида при достаточно широком варьировании однородных в некотором отношении стимулов.
Наиболее широкое свое развитие психометрический подход нашел в тестовой методике, основы которой были заложены А. Бинэ и Б. Симоном. В качестве базиса шкалы измерений в этом случае принимается интервал вариаций успешности решения некоторой категории задач, обнаруживаемый при выполнении их достаточно большой группой испытуемых, однородных по некоторому признаку (возраст, образование, профессия и т.п.).
Характер получаемой при этом шкалы измерений зависит от того: 1) -как формируется критерий меры успешности выполнения теста испытуемым; 2) как формируется критерий упорядочения испытуемых в зависимости от меры успешности выполнения ими теста; 3) какие виды преобразований используются для числового выражения положения испытуемого "на шкале оценки измеряемых его свойств.
По первому признаку все тестовые шкалы можно подразделить на простые и дифференциальные.При простом шкалировании всем вопросам теста приписывается одинаковое значение. Мера успешности выполнения теста (score) образуется простым суммированием числа правильных ответов (с поправкой на угадывание для тестов с множественным выбором ответа). При дифференциальном шкалировании каждому ответу или вопросу приписывается определенное скалярное значение, которое выражается на континууме измеряемого психического свойства как отметки его уровня.
Характер этой процедуры зависит от наличия или отсутствия возможности заранее достаточно точно установить относительные размеры интервалов, с которыми соотносятся соответствующие ответы или вопросы на континууме измеряемого психического свойства.
При предположении, что такая возможность имеется, применяются метод шкалы графических оценок или метод одинаково выглядящих интервалов, а также их различные вариации, как, например, шкала продукции, шкала от человека к человеку, шкала числовых оценок, шкала определенных групп, методы суммарных оценок, принудительного выбора взаимных средних и др.
Суть их всех заключается в предъявлении испытуемому задачи расположить в порядке нарастания (или убывания) ряд заранее проградуированных по интенсивности стимулов.
В случае, когда имеется возможность воспринять только порядок интервалов или только очень неточно их размер на континууме измеряемого свойства или отношения, градирование шкалы измерений приходится осуществлять, исходя из свойств самих тестовых данных.
Основные методы, которые используются для этой цели, это – метод попарных сравнений и метод последовательных интервалов.
При их использовании градуирование стимулов по интенсивности осуществляется после предъявления теста на основе статистического анализа ответов испытуемых.
По характеру критерия упорядочения испытуемых в зависимости от меры успешности выполнения теста все психометрические шкалы можно подразделить на нормативные и ненормативные.
В нормативных шкалах характер преобразования итогов теста в числовую оценку достижений или психических свойств испытуемого на психометрической шкале зависит от достижений некоторой эталонной группы испытуемых. В тестах «общего интеллекта» – это так называемое «частное интеллекта». В тестах отдельных способностей для той же цели используются процентили.
Ненормативные шкалы не зависят от результатов, показанных группой или группами индивидов. Они образуются обычно по итогам индивидуального теста на основе предварительного градуирования входящих в него заданий.
Состоятельность теста статистически испытывается численностью эталонной группы, ее вариативностью по изучаемому признаку, корреляцией между тестовыми оценками и оценками, полученными с помощью иных критериев (успеваемостью, успешностью профессиональной деятельности, мнением педагогов и т.п.).
Вместе с тем, всем перечисленным методикам присущи общие принципиальные недостатки, которые значительно ограничивают область их применимости и психолого-педагогическую значимость полученных результатов. Наиболее существенные из них:
1. Гипотеза о нормальном характере распределения индивидуальных вариаций измеряемых переменных.
2. Предположение о линейной связи используемых индикантов с определенными психическими свойствами или признаками (например, объемом памяти, общим интеллектом, абстрактным мышлением и т.п.).
3. Предположение, что свойства личности и психические свойства, имеющие количественные различия, могут рассматриваться как непрерывные переменные.
4. Предположение, что эти свойства допускают числовые определения и обладают аддитивностью.
Есть, однако, основания полагать, что отмеченные затруднения не свидетельствуют о неразрешимости задачи количественного описания психолого-педагогических явлений и процессов. Они свидетельствуют лишь о том, что эта задача не может быть решена с позиций чисто феноменологического подхода без учета и анализа содержания самой психической деятельности.