Экспериментальная психология. Работы В. Вундта, Ф. Гальтона, Г. Эббингауза, Д. Кеттелла
ЛЕКЦИЯ № 1. Основы классической теории тестов
Экспериментальная психология. Работы В. Вундта, Ф. Гальтона, Г. Эббингауза, Д. Кеттелла
Психодиагностикакак особая научная дисциплина прошла значительный путь развития и становления. Рассмотрим основные этапы этого пути.
Психологическая диагностика выделилась из психологии и начала складываться на рубеже XX в. под воздействием требований практики. Ее возникновение было подготовлено несколькими направлениями в развитии психологии.
Первым ее источником стала экспериментальная психология, поскольку экспериментальный метод лежит в основе психодиагностических методик, разработка которых и составляет сущность психодиагностики. Психодиагностика выросла из экспериментальной психологии, а ее возникновение в 1850-1870-е гг. связано с возросшим влиянием естествознания на область психических явлений, с процессом «физиологизации» психологии, заключавшемся в переводе изучения особенностей человеческой психики в русло эксперимента и точных методов естественных наук. Первыми экспериментальными методами психологию снабдили другие науки, главным образом физиология.
Началом возникновения экспериментальной психологии условно считается 1878 г., так как именно в этом году Вильгельм Вундт (1832–1920)основал в Германии первую лабораторию экспериментальной психологии. В. Вундт, намечая перспективы построения психологии как цельной науки, предполагал разработку в ней двух непересекающихся направлений: естественно-научного, опирающегося на эксперимент, и культурно-исторического, в котором главную роль призваны играть психологические методы изучения культуры (психологии народов). По его теории, естественно-научные экспериментальные методы можно было применять только к элементарному, низшему уровню психики. Экспериментальному исследованию подлежат не сама душа, а только ее внешние проявления. Поэтому в его лаборатории изучались в основном ощущения и вызываемые ими двигательные акты – реакции, а также периферическое и бинокулярное зрение, цветоощущение и пр.
По образцу лаборатории В. Вундта создаются подобные экспериментальные лаборатории и кабинеты не только в Германии, но и в других странах (Франции, Голландии, Англии, Швеции, Америке).
Развивающаяся экспериментальная психология вплотную подошла к изучению более сложных психических процессов, таких как речевые ассоциации (метод свободных словесных ассоциаций Гальтона). Сразу же после публикации Ф. Гальтона в 1897 г. В. Вундт использовал ассоциативную методику в своей лаборатории, хотя и считал высшие функции не подлежащими эксперименту. Получаемые в опытах индивидуальные различия во времени реакции объяснялись характером ассоциаций, а не индивидуальными особенностями испытуемых.
Однако автором, создавшим первый, собственно психологический экспериментальный метод, был Герман Эббингауз (1850–1909), который изучал законы памяти, используя для этого наборы бессмысленных слогов (искусственных сенсомоторных элементов речи, не имеющих конкретного значения). Он полагал, что полученные им результаты не зависели от сознания испытуемого, интроспекции (наблюдения индивида за тем, что происходит в его психике) и, следовательно, в большей степени удовлетворяли требованию объективности. Этим методом Эббингауз открыл путь экспериментальному изучению навыков.
Американский психолог Джеймс Кеттелл (1860–1944)исследовал объем внимания и навыки чтения. С помощью тахистоскопа (прибора, позволяющего предъявлять испытуемому зрительные стимулы на краткие отрезки времени) он определял время, необходимое для того, чтобы воспринять и назвать различные объекты – формы, буквы, слова и т. д. Объем внимания в его опытах составлял величину порядка пяти объектов. Проводя эксперименты с чтением букв и слов на вращающемся барабане, Кеттелл зафиксировал феномен антиципации («забегания» восприятия вперед).
Так, на рубеже XX в. в психологии утвердился объективный экспериментальный метод, который начал определять характер психологической науки в целом. С внедрением в психологию эксперимента и появлением благодаря этому новых критериев научности ее представлений создались предпосылки для зарождения знаний об индивидуальных различиях между людьми.
Linda Croker, James Algina: Introduction to Classical and Modern Test Theory
Линда Крокер, Джеймс Алгина «Введение в классическую и современную теорию тестов»
(Москва, Логос, 2010)
Основной вопрос при использовании этого коэффициента состоит в определении оптимального времени между тестированиями. На этот вопрос нет однозначного ответа. С одной стороны, он должен быть достаточно долгим, чтобы позволить исчезнуть эффекту запоминания. С другой стороны, он должен быть не таким долгим, чтобы допустить влияние развития. Обычно период от одного тестирования до другого выбирают от одного дня до двух недель.
В основном мы находимся в ситуации, когда единственная форма теста может быть предъявлена группе испытуемых один раз. В этом случае для исследования надежности рассматривается согласованность между собой результатов одних и тех же испытуемых по всем заданиям теста. Процедуры, разработанные для оценивания надежности таким способом, называются методами внутренней согласованности.
Наиболее известный метод в этой группе методов - метод расщепления.При использовании этого метода тест делится на два субтеста и находится корреляция между тестовыми оценками по двум половинам теста. Основная идея при этом, чтобы создать субтесты, которые являются настолько параллельными, насколько это возможно. Существуют 4 признанных способа деления теста пополам:
- задания с нечетными номерами помещают в первый субтест, с четными – во второй;
- задания упорядочивают по уровню трудности, а потом делят на два субтеста по четным и нечетным номерам;
- задания распределяются по субтестам случайным образом, чтобы в каждом субтесте была половина заданий;
- задания распределяются по субтестам так, чтобы они образовали формы, адекватные по содержанию.
Отметим, что в результате расщепления длина теста уменьшается в два раза, поэтому коэффициент надежности, вычисленный этим способом, недооценивает (занижает) коэффициент надежности всего теста, т.к. более длинные тесты более надежны. Чтобы преодолеть эту проблему для коррекции коэффициента надежности используют формулу Спирмена-Брауна:
,
где - коэффициент надежности, вычисленный по методу расщепления; - предполагаемая надежность теста полной длины.
Основной недостаток процедуры расщепления состоит в том, что в зависимости от способа деления теста пополам, коэффициенты надежности будут иметь разные значения. Поэтому были разработаны другие методы, среди которых наибольшую известность приобрели коэффициент альфа Кронбаха и формула Кьюдера-Ричардсона (KR-20). Эти формулы приводят к идентичным результатам.
Коэффициент альфа Кронбаха вычисляется по формуле:
где k – число заданий в тесте, - дисперсия оценок по заданию i, - общая дисперсия по тесту. Коэффициент альфа применяется для тестов и с дихотомической оценкой, и с политомической. В данном методе предполагается, что каждое задание теста образует собственный субтест, при этом все субтесты строго параллельны. В большинстве ситуаций тестирования это предположение не состоятельно, поэтому мы можем только утверждать, что надежность теста не меньше, чем вычисленный коэффициент альфа. Говорят, что коэффициент альфа задает нижнюю границу коэффициента надежности. Например, если коэффициент альфа получился равным 0,8, то мы можем утверждать, что, по крайней мере, 80% дисперсии наблюдаемых оценок является следствием дисперсии истинных баллов испытуемых.
Коэффициент альфа может быть вычислен различными способами. Один из самых известных – формула Кьюдера-Ричардсона (KR-20). Она применима только к случаю, когда тест состоит только из дихотомических заданий, и имеет вид:
где k – число заданий в тесте, - трудность задания i, , - общая дисперсия по тесту.
Выбор коэффициента надежности зависит от предполагаемого источника ошибок, но, как правило, используются различные методы. Отметим, что коэффициент надежности зависит от свойств выборки испытуемых, по результатам тестирования которой он был получен. Поэтому потенциальные пользователи тестов должны убедиться, что сообщаемый в документах к тесту коэффициент надежности получен на выборке, подобной по составу той группе, для которой будет использоваться тест. В противном случае надежность надо переоценить заново, применительно к имеющейся группе испытуемых.