Групповые тесты в сравнении с индивидуальными
Типичные различия в конструкции тестов.Групповые тесты неизбежно отличаются от индивидуальных формой и организацией заданий. Хотя в них и можно было бы применять вопросы, допускающие неограниченное количество ответов в свободной форме, — как это имело место в первых групповых тестах, — в типичных современных групповых тестах используются задания с множественным выбором (multiple-choice items). Это изменение очевидно было вызвано требованиями единообразия и объективности при подсчете баллов. Другое важное различие между традиционными индивидуальными и групповыми тестами состоит в контроле трудности заданий. В индивидуально проводимых тестах тестирующий следует правилам определения начального, базального и предельного уровней, чтобы обеспечить каждому тестируемому проверку с помощью заданий, соответствующих его уровню способности. В групповых тестах сходные по содержанию задания располагаются в порядке возрастающей трудности в виде относительно самостоятельных, разделенных во времени субтестов (separately timed subtests). Такая организация заданий дает тестируемому возможность попробовать свои силы в каждом их типе (например, на словарный запас, арифметику, пространственные отношения и т. д.) и выполнить более легкие из них до того, как приступить к более трудным, на попытки справиться с которыми у него, в противном случае, могла бы уйти впустую значительная часть отведенного времени.
Однако практическая трудность, встречающаяся при использовании раздельных субтестов, состоит в том, что менее опытные и менее внимательные пользователи могут допускать ошибки временной организации тестирования (timing errors). Такие ошибки, по-видимому, чаще встречаются и имеют более серьезные последствия при установлении нескольких коротких лимитов времени (для каждого субтеста), чем при работе с одним, достаточно большим временным лимитом (для теста в целом). Чтобы совместить использование одного лимита времени на весь тест с таким расположением заданий, которое позволило бы всем тестируемым испробовать все типы заданий на последовательно возрастающих уровнях трудности, в некоторых тестах применяется спиральное расположение заданий (spiral-omnibus format). Одним из первых примеров такого расположения заданий дают Самоприменяемые тесты умственных способностей Отиса (Otis Self-Administering Tests of Mental Ability), в которых, как указывает их название, предпринята попытка свести роль проводящего обследование к минимуму. В тесте со спиральным расположением заданий самые легкие задания каждого типа предъявляются первыми, затем идет следующий по степени трудности ряд заданий каждого типа и т. д., примерно так, как это показано ниже:
Часть 3. Тестирование способностей
Ответ
1. Противоположным ненависти является: а) вражда, б) страх,
в) любовь, г) дружба, д) радость...........................................................................( )
2. Если 3 карандаша стоят 25 центов, сколько карандашей можно купить на 75 центов?.................................................................................................( )
3. У птицы не всегда бывают: а) крылья, б) глаза, в) ноги,
г) гнездо, д) клюв.......................................................................................................( )
4. Противоположным чести является: а) слава, б) бесчестье,
в) трусость, г) страх, д) поражение.......................................................................( )
Для того чтобы избежать необходимости повторять инструкции для каждого задания и сократить число переключений с одной установки на другую, требуемых от испытуемого инструкциями к заданиям разных типов, в некоторых тестах по спирали располагаются не единичные задания, а блоки из 5-10 заданий.
Преимущества группового тестирования.Групповые тесты разрабатываются в первую очередь как инструменты массового тестирования. По сравнению с индивидуальными тестами у них есть свои достоинства и свои недостатки. Позитивной стороной групповых тестов является возможность проводить их одновременно с таким большим количеством людей, которое только можно удобно разместить в пригодном помещении, размеры которого ограничиваются, пожалуй, лишь пределом слышимости голоса тестирующего, пользующегося микрофоном. Именно развитие методов группового тестирования сделало возможным реализацию программ массового тестирования. Благодаря использованию заданий теста в отпечатанном виде и простых ответов, легко фиксируемых в тестовой тетради, на бланке ответов или с помощью компьютера, отпала необходимость взаимодействия тестирующего и тестируемого один на один.
Еще одной особенностью группового тестирования, облегчившей проведение массовых обследований, явилось значительное упрощение функций проводящего тест. В отличие от всесторонней подготовки и большого опыта, необходимых пользователю, например, при тестировании по шкале Стэнфорд—Бине, для предъявления большинства групповых тестов от него требуется лишь умение зачитывать простые инструкции испытуемым и точно соблюдать время. Конечно, желательно проводить с пользователями групповых тестов предварительные тренировочные занятия, так как неопытность может стать причиной отклонения от стандартизованной процедуры тестирования и тем самым сказаться на результатах теста. В то же время при групповом тестировании могут быть обеспечены более единообразные условия, чем при индивидуальном, поскольку роль тестирующего сведена к минимуму. Использование магнитофонных записей инструкций и компьютерного предъявления заданий теста открывает дополнительные возможности для процедуры стандартизации и устранения фактора различий между проводящими массовое тестирование специалистами. Подсчет показателей при групповом тестировании обычно носит более объективный характер и может быть выполнен даже вспомогательным персоналом. В настоящее время большинство групповых тестов вообще предполагает компьютерную обработку результатов.
Кроме того, групповые тесты, как правило, позволяют получить более точные и надежные нормы, чем индивидуальные. Вследствие относительной легкости и быст-
Глава 10. Групповое тестирование
роты сбора данных с помощью групповых тестов, обычно в процессе их стандартизации тестированию подвергаются большие, репрезентативные выборки. Для большинства современных стандартизованных групповых тестов нет ничего необычного в том, что их нормативные выборки насчитывают от 100 000 до 200 000 человек, в отличие от 1000 (максимум — 8000) случаев, с трудом накопленных в ходе стандартизации даже наиболее тщательно разработанных индивидуальных шкал интеллекта.
Недостатки группового тестирования.Хотя групповые тесты обладают некоторыми желательными свойствами и выполняют практически незаменимую функцию в современном тестировании, следует отметить и их ограничения. При групповом тестировании у проводящего тест гораздо меньше возможностей для того, чтобы установить раппорт с испытуемыми, добиться от них сотрудничества и поддерживать их интерес. Любые временные состояния испытуемого, такие как нездоровье, утомление, беспокойство или тревога, которые могут помешать выполнению заданий, гораздо труднее обнаружить при групповом тестировании, чем при индивидуальном. В целом лица, непривыкшие к тестированию, скорее покажут более низкие результаты в групповых тестах, нежели в индивидуальных. Существуют данные, свидетельствующие о том, что дети с нарушениями эмоциональной сферы лучше выполняют индивидуальные тесты, чем групповые (Bower, 1969; Willis, 1970).
С другой стороны, групповые тесты неоднократно подвергались нападкам за ограничения, налагаемые на ответы испытуемых. Особенно критикуются задания с множественным выбором ответов и такие стандартные типы заданий, как аналогии, нахождение сходства и классификация (Hoffman, 1962; LaFave, 1966). Ряд критических замечаний носит оригинальный характер и стимулирует совершенствование заданий групповых тестов. Одно из направлений этой полемики касается того, что такие задания ставят в невыгодное положение тех, кто блестяще и оригинально мыслит, кто ищет и стремится выразить в ответах необычный смысл. Заметим, кстати, что если это и происходит, то очень редко, о чем говорят анализ заданий и данные по валидности. Если все же такое случится в одном или двух заданиях предъявляемого индивидууму теста, то едва ли окажет заметное влияние на совокупный показатель данного испытуемого. Некоторые критики, что характерно для подхода Пиаже (Sigel, 1963), указывают на важность анализа ошибок и выяснения причин, которые побуждают индивидуума выбирать определенный ответ. Несомненно, групповые тесты почти или совсем не позволяют непосредственно наблюдать поведение испытуемых и устанавливать источник нетипичного выполнения тестов. По этой и другим причинам, когда принимаемое по результатам тестирования решение важно для испытуемого, желательно дополнить результаты группового тестирования либо индивидуальной проверкой неясных случаев, либо информацией, полученной из других источников.
Еще одним ограничением традиционного группового тестирования является его Недостаточная гибкость, поскольку каждый обследуемый тестируется одинаково по всем заданиям, хотя отводимое для тестирования время может быть использовано более эффективно, если каждый испытуемый сосредоточит свои силы на заданиях, соответствующих его уровню способностей. Более того, такая процедура могла бы помочь избежать скуки при выполнении слишком легких заданий, с одной стороны, а с другой — способствовала бы снятию фрустрации и тревожности при попытке выполнить задания, превышающие по сложности уровень способностей индивидуума. Индивидуальные тесты в типичных случаях позволяют тестирующему выбирать за-
Часть 3- Тестирование способностей
дания на основе предшествующих ответов тестируемого. Это различие между индивидуальными и групповыми тестами особенно важно, когда тест предназначен для охвата широкого диапазона измеряемой способности.