Надежность методов исследования
Критерии и показатели в оценке методов исследования.Надежность методов психолого-педагогического исследования во многом зависит от критериев и показателей, по которым происходит изучение выбранного для исследования образовательного феномена.
Критерий (от греч. кгНепоп — средство для суждения) — это признак, на основании которого производится оценка, определение или классификация чего-либо; мерило оценки. В диагностике критерием является переменная величина, принимающая разные значения в различных случаях или в разные моменты времени в рамках одного случая. Критерии дают возможность судить о состоянии объекта исследования.
Показатель (тШса(ог — то, что доступно восприятию, то, что «показывает» наличие чего-либо) — это некоторая величина или качество переменной (критерия), которое может проявляться у конкретного объекта, т. е. это мера проявления критерия, его количественная или качественная характеристика, по которой судят о различных состояниях объекта; это внешне хорошо различимый признак измеряемого критерия. Можно сказать, что показатель выполняет роль эмпирического индикатора критерия.
Внешние показатели поведения опасно принимать за сущностные признаки, это приводит к ошибкам в квалификации социально-психологического новообразования, характеристиках воспитанности.
Представим, что детям свойственны послушание, исполнительность, вежливость, аккуратность. Эти позитивные показатели не могут не радовать. Но стоит задуматься об истоках данных характеристик и о том, как позитивные показатели преобразуются в негативные. Допустим, страх перед учителем и боязнь наказания вынуждают детей выстраивать поведение в рамках положительных характеристик. Хотя, разумеется, основой для них могут быть познавательный интерес и уважение к преподавателю, организующему процесс познания.
Фиксируя показатели, педагогическое наблюдение должно иметь своим основным объектом вовсе не их, а признаки воспитанности, т.е. отношение к ценностям жизни (согласно программе воспитания). Всегда за показателями, если они воспроизводятся много раз, можно распознать реальное отношение к определенному объекту. Показатели свидетельствуют о реальном отношении к объекту часто без воли и сознания самого ребенка. Просто и естественно реагируя на окружающий мир, ребенок отражает во внешнем рисунке поведения проживаемое отношение к определенному объекту. Если профессиональное восприятие заметит такое многоразовое отражение, можно констатировать реальность конкретного отношения1.
Принято считать, что количество критериев должно составлять не менее трех, а по каждому критерию следует выделять как минимум три показателя. Только тогда можно говорить о полном отображении объекта и предмета диагностики и проявлении каждого соответствующего критерия.
Определение критериев и признаков объекта позволяет осуществить переход от абстрактного уровня его описания к конкретным
наблюдениям.
Общие требования к методам исследования.Насколько можно доверять данным, которые получены с помощью различных методов? Годятся ли они для математической и статистической обработки? Чтобы исследование не превратилось в самоцель, а стало средством совершенствования образовательной практики, каждая методика должна иметь следующие составляющие:
1) описание, обеспечивающее ее адекватное использование в точном соответствии со стандартами: предмет диагностики, сфера применения, контингент испытуемых, процедура применения;
2) подробные сведения о процедуре разработки методики, полученных при этом данных о надежности и валидности;
3) однозначное описание выборки стандартизации и характера диагностической ситуации в обследовании;
1 Щуркова Н.Е. Педагогическая технология. — М., 2005.
4) процедура подсчета баллов и интерпретации должна быть описана с однозначной ясностью, позволяющей получить идентичные результаты при обработке одинаковых протоколов разными пользователями руководства.
В начале XX в. в психологии были официально признаны и приняты требования, предъявляемые к понятиям и методам исследования и диагностики в наиболее развитых современных науках, — требования операционализации и верификации.
Под операционализацией понимается требование, согласно которому при введении новых научных понятий необходимо четко указывать на конкретные процедуры, приемы и методы, с помощью которых можно практически удостовериться в том, что явление, описанное в понятии, действительно существует. Опе-рационализация предполагает указание на практические действия или операции, которые может выполнить любой диагност, чтобы убедиться в том, что определенное в понятии явление обладает именно теми свойствами, которые ему приписываются.
Требование верификации означает, что всякое новое понятие, вводимое в научный оборот и претендующее на получение статуса научного, обязательно должно пройти проверку на наличие методики экспериментальной диагностики описанного в нем явления. Качество результатов диагностики при этом принято оценивать по общепринятым критериям объективности, надежности, валидности и др.
Объективность характеризуется корреляцией (совпадением или согласованностью) между результатами, полученными двумя оценивающими лицами. Необходимо, чтобы коэффициенты корреляции в этом случае были близки к единице (г = 1).
Объективность связана с чистотой измерения (испытания), максимально исключает субъективизм в оценке результатов диагностики в целом. Констатация и оценка или измерение и интерпретация должны быть максимально отделены друг от друга. С этой целью должны быть составлены точные инструкции проведения работы, исправления ошибок и оценки результатов.
Для большей объективности обработки данных рекомендуется в анкетировании, тестировании, наблюдении использовать косвенные (диагностируемые факты не называются, а предполагаются), альтернативные (с несколькими вариантами ответов) вопросы. В целях обеспечения объективности проведение, обработка и интерпретация (оценка) результатов работы должны быть строго нормированы.
Стандартизация — это единообразие процедуры проведения и оценки выполнения диагностического метода. Стандартизирован-ность в диагностике — это неизменность заданных вопросов и задач, точность соблюдения испытуемыми инструкции, а диагностами — способов вычисления и интерпретации полученных по-
казателей. Сопоставимость в педагогической диагностике допускает более широкое сравнение результатов тестирования с данными других научно-практических методов: наблюдения, беседы, анализа продуктов деятельности (письменных работ, рисунков, поделок), поведения и общения.
Объективность проведения измерений требует, например, чтобы все учащиеся были подвергнуты одному и тому же испытанию в аналогичных условиях (испытание должно длиться для всех одинаковое количество времени; необходимо следить за тем, чтобы учащиеся не списывали друг у друга в процессе выполнения работы и т.д.).
Стандартизация предусматривает унификацию инструкций рабочих бланков, способов регистрации результатов, условий проведения обследования. Унифицированные задания для всех испытуемых, одинаковый отрезок времени диагностирования, четкое описание критериев оценки, равные условия взаимодействия испытуемых с диагностом — основа объективности результатов диагностики.
Об объективности интерпретации можно говорить в том случае, если несколько лиц одинаковым образом описывают одни и те же результаты при обработке данных, устанавливают одни и те же взаимосвязи, так как при оценке разными людьми одной и той же работы испытуемого с открытыми вопросами (свободной формой конструирования ответа) может отличаться субъективность обработки данных. Объективность — предпосылка надежности и валидности измерения.
Надежность метода исследования.Надежность — один из критериев качества результата в диагностике, относящийся к степени точности и устойчивости показателей диагностируемого признака. Чем больше надежность методики, тем свободнее она от погрешностей измерения. В самом широком смысле надежность — это характеристика того, в какой степени выявленные у испытуемых различия по результатам проведения методики являются отражением действительных различий в измеряемых свойствах и в какой мере они могут быть приписаны случайным ошибкам.
В теории диагностики понятие надежности имеет два значения: надежность методики как определенного инструмента (к примеру, пользуясь метром, мы уверены в том, что он остается неизменным, какие бы измерения мы ни производили) и относительная неизменность объекта диагностики (мы должны быть уверены, что в обычных условиях измеренная величина останется неизменной).
Понятие надежности связано с точностью измерений, вернее, с оценкой погрешности и определением на этой основе истинного значения величины.
Существуют три основных приема для оценки надежности диагностической методики.
Прием ретеста, или повторной диагностики, позволяет обработать одни и те же задания, выполненные одними и теми же испытуемыми в разное время, и просчитать взаимосвязь результатов, выраженную в коэффициенте самокорреляции.
Прием деления пополам — подборка однажды выполненных заданий делится пополам (например, в первый полутест входят задания с нечетным порядковым номером, а во второй полутест — с четным), затем устанавливаются результаты каждого испытуемого по обоим полутестам и вычисляется коэффициент корреляции между полученными результатами.
Прием параллельного теста — для измерения одних и тех же знаний конструируются два различных набора заданий, которые по своему содержанию напоминают близнецов; оба параллельных набора заданий предлагаются непосредственно друг за другом или при удобном случае.
Во всех случаях при коэффициенте корреляции методик /•> 0,7 методика считается надежной (о коэффициенте корреляции см. в разд. 4.2).
В тестовой методике принято учитывать три коэффициента надежности:
1) коэффициент стабильности, или постоянства, — показатель корреляции между результатами первого и повторного испытаний одним тестом одной и той же выборки испытуемых;
2) коэффициент эквивалентности, или коэффициент корреляции, результатов тестирования одного и того же контингента испытуемых с помощью вариантов одного и того же теста либо разными, но эквивалентными по форме и цели, тестами;
3) коэффициент внутреннего постоянства, или внутренней однородности, который соответствует корреляции результатов частей теста, показанных одними и теми же испытуемыми.