Генезис и развитие метода тестирования

Термин «тест» [< англ. test – проба, проверка, опыт, испытание, исследование] был введен основателем тестовой диагностики американским психологом Д.Кеттелом в конце XIX века. Позднее тесты совершенствовали французский психолог А.Бине, позже другой американский психолог Э.Торндайк и его ученики. Тест – это стандартизированное задание или система контрольных заданий, нацеленных на измерение актуального уровня знаний, умений и навыков, а также способностей испытуемого. Соответственно, под тестированием понимается метод психолого-педагогической диагностики, применяющий стандартизированные задания.

Тестовая методика с момента зарождения постоянно находилась в процессе совершенствования. Альфред Бинэ (1857-1911) один из основоположников учения о тестах. Им разработана (в вариантах теста 1908 и 1911 гг.) система возрастных шкал для диагностики детей. Он сгруппировал тестовые задания по возрастным группам, в которых «нормальные» дети решали их на 50-90%. Если данную задачу решало около 75% определенного количества детей одинакового возраста, она считалась показательной для данного возраста. По числу заданий, которые решил ребенок, вычислялся возраст его интеллектуального развития. Задания, как правило, предполагали владение логическими, логико-перцептивными и арифметическими действиями, выявляли общую осведомленность, ориентировку в практических ситуациях, произвольную память и пр. Таким образом была составлена серия тестов для каждого возраста.

Однако этот возраст интеллектуального развития может сообщить что-то об умственных способностях ребенка и перспективах его развития только в том случае, если его сопоставить с возрастом жизни ребенка. Поэтому немецкий психолог Вильям Штерн (1871-1938) предложил разделить возраст интеллектуального развития на возраст жизни и получить таким образом сопоставимый коэффициент интеллектуального развития. Чтобы получить целые числа, полученную величину умножали на 100. Величина, равная 100, соответствовала совпадению возраста интеллектуального развития и возраста жизни и обозначала тем самым средний уровень интеллектуального развития. Английский психолог Берт, а также американский ученый Термен попытались усовершенствовать эту систему. По их именам названы шкалы Бине-Берта и Бине-Термена.

Шкала тестов Бине-Термена устроена таким образом, что на каждый период детского возраста дает шесть тестов. Каждый тест считается за два месяца. Вначале испытуемому предъявляли задания, которые соответствовали возрасту на год меньшему, чем его собственный. Он должен был дать подряд пять правильных ответов. Этим фиксировался умственный «базовый возраст». Далее необходимо было к числу тестов «базового возраста» прибавить число всех правильных ответов. К примеру, если ребенок решил все задачи его возраста, допустим, для 6 лет и примерно три теста для более старших детей, то его умственный возраст считается равным 6 годам и 6 месяцам. В этом случае коэффициент интеллекта для данного ребенка высчитывается по формуле:

, Генезис и развитие метода тестирования - student2.ru

Где УВ – умственный возраст (в соответствии с тестами);

ХВ – хронологический (паспортный) возраст.

IQ - «Ай-кью» - равняется умственному возрасту (в данном случае 6,5 лет), умноженному на 100 и деленному на действительный хронологический возраст ребенка (в нашем примере 6 лет). Для нашего примера коэффициент умственного развития ребенка будет равен приблизительно 108%, что является чуть выше нормы.

Впервые шкала IQ была применена в 1916 г. при адаптации теста Бине-Термена. Но применение данной шкалы сразу натолкнуло исследователей на тот недостаток, что невозможно рассчитать возраст жизни старше 16 или 19 лет, так как не было заданий, могущих выявить прогресс в возрасте интеллектуального развития. Вследствие чего невозможно было разработать шкалу коэффициента интеллекта для взрослых.

Д. Векслер в 1939 г. рассчитал для этого теста стандарты, полученные при вычислении отклонений от средней величины конкретной взрослой группы. Тем самым, он полностью отказался от определения возраста интеллектуального развития и деления его на возраст жизни. В этом случае название «коэффициент интеллекта» более не соответствовало существу полученной величины, но было сохранено ввиду широкой распространенности этого термина. Эту новую величину, сразу же вошедшую в научный обиход, называют «IQ-отклонением». Она характеризуется средней величиной, определяемой при выверке репрезентативной выборки, которая умножается на 100 и имеет стандартное отклонение в положительную или отрицательную стороны равную примерно 15 единицам.

На первом этапе создания тестов IQ испытуемого исчисляли путем деления умственного возраста на хронологический возраст, при этом основное внимание уделялось повышению качества измерений на основе главным образом классического аппарата теории погрешностей измерений. С накоплением экспериментального опыта теория тестов стала развиваться на базе латентно-структурного анализа (П. Лазарсфельд и др.) и связанного с этим анализом ряда математических моделей измерения. Теперь используется математическая теория оценки качества заданий и параметров личности. На этой основе делаются все современные тесты. Отклонения от коэффициента интеллектуального развития вычисляются при подсчете отклонения отдельных результатов от средней величины (нормально распределенных) данных. На шкале, с помощью которой определяется отклонение от коэффициента интеллектуального развития, средняя величина составляет 100, а стандартное отклонение в обе стороны примерно 15 единиц IQ.

Типы тестирования

Существуют три основных сферы тестирования: 1) тестирование в образовании; 2) профессиональное тестирование; 3) психологическое тестирование. Во всех трех сферах применяют следующие виды тестов: личностные, проективные, тесты интеллекта, тесты достижений, тесты креативности, тесты критериально-ориентированные.

Личностные тесты – методы психодиагностики, с помощью которых измеряют различные стороны личности индивида: установки, ценности, отношения, эмоциональные, мотивационные и межличностные свойства, типичные формы поведения. Обычно личностные тесты применяются в одной из форм: 1) шкалы и опросники; 2) ситуационные тесты или тесты действия, использующие перцептивные, когнитивные или оценочные задачи (определяется усвоение знаний), оценку себя, своих личностных конструктов и пр.

Проективные тесты – [< лат. projectio – выбрасывание вперед] – совокупность методик целостного изучения личности, основанного на психологической интерпретации результатов проекции. Составители проективных тестов исходят из предположения о том, что человек всегда преобразует (хотя бы в восприятии и представлении) ситуацию, в которой он оказался, «насыщает» ее собственными проблемами, «проецирует» на нее содержание своей личности, так как процесс восприятия всегда обусловлен следами прошлых впечатлений. Сюда относятся, например, тест чернильных пятен Роршаха, тест по объяснению сюжета на картинках и др. Проективные тесты конструируются в двух видах. В ассоциативном проективном тесте предлагаются незаконченные предложения, рассказы, рисунки и др. В экспрессивном тесте предлагается принять участие в психодраме, игре, рисовании на свободную тему и др. Достоинством методики проективных тестов является то, что они облегчают демонстрацию скрытого содержания внутреннего мира субъекта, которые он не может выразить открыто. Это позволяет сориентироваться в сложных свойствах личности, не поддающихся точной оценке.

Тесты интеллекта – методики психодиагностики, ориентированные на выявление умственного потенциала индивида. Обычно в интеллектуальных тестах испытуемому предлагается установить логические отношения классификации, аналогии, обобщения и др. между терминами и понятиями, из которых составлены задачи теста. Иногда в задачах теста необходимо правильно составить рисунок, собрать геометрическую фигуру, сложить из представленных деталей изображение предмета и др.

Тесты достижений – одна из методик психодиагностики, выявляющая степень владения испытуемым конкретными знаниями, умениями, навыками. Направлены на выявление уровня усвоенности конкретных навыков, а не обобщенных умений, которые человек приобретает в итоге разнообразного жизненного опыта. Тесты достижений проводятся в трех формах: 1) тесты действия; 2) тесты письменные и 3) тесты устные. Тесты действия выявляют умения оперировать инструментами, механизмами, материалами. В письменных тестах необходимо выбрать верный ответ среди нескольких предложенных либо отметить что-то на графике, либо указать что-то в предложенном рисунке. Устные тесты достижений – заранее подготовленная система вопросов, на который испытуемый должен дать правильные ответы.

Тесты креативности [< лат. creatio – сотворение, создание] – методики для изучения и оценки творческих способностей личности. Диагностика творческих способностей ведется в двух направлениях: анализ жизненного опыта и индивидуальных особенностей творческой личности; анализ творческого мышления и его продуктов. Вопрос о креативности как о самостоятельном, независимом от интеллекта свойстве, пока остается нерешенным. Тесты креативности до сих пор остаются не надежными. При их помощи можно измерить такие качества, как беглость, гибкость мышления, оригинальность, чувствительность к проблемам и некоторые другие, но творческие достижения требуют более сложного сочетания способностей и свойств личности.

Более-менее корректному измерению доступны далеко не все творческие достижения, а только конвергентные. Конвергентными [<лат. convergere – приближаться, сходиться] называются такие достижения, которые могут быть выражены в правильном или однозначно лучшем результате. Это громадная сфера в самых различных специальных областях и на различных уровнях, которая простирается от знания фактов до аргументированной оценки. Конвергентные успехи в учебе вполне доступны измерению. Иначе обстоит дело с дивергентными творческими достижениями.

Дивергентные [< лат. divergere – отклоняться, расходиться] достижения те, которые могут привести ко многим в принципе равноправным результатам. Типичным примером является сфера креативного, художественного творчества. Одна и та же тема может быть разработана с помощью музыкальных, поэтических, изобразительных средств в различных вариациях, которые не могут быть классифицированы по принципу «правильно-неправильно» или «лучше-хуже», если абстрагироваться от более «ремесленного» аспекта, имеющего лишь второстепенное значение. Очень редко удается измерить дивергентные креативные способности, иногда с помощью вспомогательных проблемных конструкций.

Тесты критериально-ориентированные – методики психодиагностики, направленные на выявление уровня владения знаниями и навыками умственных действий, которые необходимы и достаточны для выполнения определенных классов учебных или профессиональных заданий. Критерием служит наличие или отсутствие этих знаний. Это инструмент обратной связи в организации процессов обучения. Результаты тестирования, проведенного с помощью этих методик, оцениваются не по порядковому месту испытуемого в выборке и не по отношению этих результатов к статистической норме, а по отношению ко всей сумме тестовых задач. Критериально-ориентированное тестирование позволяет обнаружить при анализе результатов недочеты умственного развития как отдельных индивидов, так и целых групп, и наметить меры для их ликвидации.

Тесты могут быть вербальные (словесные, смысловые) и невербальные (фигурные, рисуночные), то есть без слов.

По методике выполнения теста выделяют рефлективный и верификационный методы. Рефлективные тестовые задания подразделяются на два вида: 1) элективные [< лат. electus – избранный] задания на распознавание с выбором верного ответа из нескольких данных альтернатив, установление логической или иной связи; 2) инвентивные [< лат. inventiv – выдумка, изобретение] задания на дополнение, преобразование и на свободную форму ответа. Сущность верификационного метода выполнения тестовых заданий заключается в том, что ученик должен дать ответ типа «верно-неверно», «да-нет».

Тесты школьной успеваемости

Тесты школьной успеваемости являются методами педагогической диагностики, с помощью которого результаты планируемого учебного процесса могут быть максимально объективно, надежно и валидно измерены, обработаны, интерпретированы и подготовлены к использованию в педагогической практике учителями.

Выделяют следующие виды тестов школьной успеваемости: а) ориентированные на соотносительную группу; б) ориентированные на критерии. Также они могут быть формализованными и неформализованными (неформальными).

Тесты школьной успеваемости, ориентированные на соотносительную группу, предполагают сопоставление индивидуального результата тестирования каждого ученика с результатами, полученными с помощью релевантной выборки (чаще всего это все классы школьного выпуска). Составление тестов данного типа включает следующие этапы: а) подготовительное планирование, б) анализ учебных программ и учебников, в) конструирование заданий, г) анализ заданий, д) выверка.

Этап подготовительного планирования предполагает обдумывание следующих вопросов: кто, что и почему подлежит исследованию? Например, если необходимо определить учащихся для дополнительных занятий, то нет необходимости тестировать весь класс, можно взять лишь более слабую его половину. Необходимо продумать, какие формы успеваемости будут исследоваться – устные, письменные или моторные, что будет выноситься на первый план – умение мыслить или запоминать и т.д.

После определения цели и функции тестирования необходимо провести анализ учебных планов, программ и учебников. Здесь обращается внимание на то, каков уровень требуемых знаний, умений и навыков. Уровень узнавания изученного материала, репродуктивного воспроизведения усвоенного или творческого использования в новой ситуации.

При конструировании заданий рекомендуется создавать на 50 или 100% заданий больше, чем это требуется, ибо только часть заданий (это зависит от опыта авторов теста) выдерживает проверку.

Тесты школьной успеваемости, ориентированные на критерии,– это тесты, сообщающие индивидуальный результат учащегося по отношению к критериям, заранее установленным исследователем (педагогом) или учебной программой. В этом случае учащиеся заранее предупреждаются, что результаты предстоящего тестирования на владение грамотной письменной речью успешно пройдут лишь те, кто наберет такую-то сумму баллов. То или иное количество тестовых баллов может быть определено для получения той или иной отметки успеваемости.

Неформальные тесты школьной успеваемости являются методом педагогической диагностики, конструируемыми школьными педагогами с целью объективной фиксации результатов процесса обучения в своем классе. Неформальные тесты характеризуются отсутствием строго научного подхода на всех этапах создания. Если даже формализованные тесты никогда не дают уверенности в абсолютной надежности, то несовершенным тестам, создаваемым учителями для собственного пользования, это присуще еще в большей степени. Несовершенство измерений с точки зрения их надежности находит свое практическое выражение в вычислении стандартной измерительной ошибки, то есть величины стандартного отклонения теста, которая объясняется его надежностью.

Стандартная измерительная ошибка учитывается создателями теста в процессе его подготовки. Пользователь теста в специальном приложении к тесту предупреждается, что стандартная ошибка в измерении, допустим, составляет ±4 балла. В этом случае он знает, что «истинное» значение успеваемости для ученика, набравшего 24 балла, располагается между 20 и 28 баллами. Если знать измерительные ошибки инструментария, то можно избежать переоценки его надежности и не принимать случайные расхождения результатов при их интерпретации за подлинные различия в успеваемости.

Надежность инструментария зависит – при прочих равных условиях – от количества заданий. Для неформальных тестов ошибка в измерении может быть вычислена с помощью следующего основного правила: при количестве заданий менее 24 ошибка составляет ±2 балла; при количестве заданий между 24 и 47 ошибка составляет ±3 балла; при количестве заданий между 48 и 89 ошибка составляет ±4 балла.

Наши рекомендации