Тестовый контроль в образовании
В последнее время в обществе появились объективные потребности и условия для введения независимых методов оценки учебных достижений школьников и выпускников общеобразовательных учреждений. С 1996 г. в России по примеру развитых стран (Нидерландов, США, Австралии, Англии, Японии, Дании, Израиля, Канады, Новой Зеландии, Франции) создается система контроля и оценки знаний учащихся педагогическими измерителями. К общепринятым в образовательной практике видам контроля добавляется тестирование, осуществляемое средствами, методами и технологиями, не зависимыми от общеобразовательного учреждения. Влияние субъективного фактора, характерного для устных опросов и контрольных работ, существенно снижается при контроле, базирующемся на теории педагогических измерений. Вместе с тем правильность, эффективность, согласованность внутренних и внешних оценок качества обучения становятся необходимыми в условиях введения ЕГЭ.
Тест (от английского слова test - проверка, задание) - это система заданий, позволяющая измерить уровень усвоения знаний, степень развития определенных психологических качеств, способностей, особенностей личности.
От традиционных оценок и контроля знаний студентов тесты отличаются объективностью измерения результатов обучения, поскольку они ориентируются не на субъективное мнение преподавателей, а на объективные эмпирические критерии.
История возникновения теста
Впервые в 1864г. тесты в обучении начал применять в Великобритании Дж. Фишер. Теоретические основы тестирования были разработаны английским психологом Ф. Гальтоном в 1883г. По его мнению, тесты – это серии одинаковых испытаний группы индивидов, а также статистическая обработка результатов на основе выделения эталонов оценки.
Официально термин «тест» ввёл в научный оборот американский психолог Дж. Кеттел в 1890г. Он предложил серию из 50 тестов для определения примитивных психо-физиологических характеристик, например скорости реакции на звук. Француз А. Бине применил принципы тестологических исследований к высшим психологическим функциям человека – памяти, вниманию, эстетическому и этическому чувствам (1891г.). В 1911г. немецкий психолог В. Штерн предложил тест на индекс интеллектуального развития человека.
В начале ХХ в. наметились разграничения в педагогическом и психологическом тестировании. Первый стандартизованный педагогический тест был составлен американским психологом Э. Торндайком (1874-1949).
В России тесты привлекли внимание педагогической общественности в 20-х годах. В 1926г. был даже опубликован сборник тестов для школ, но спустя 10 лет они были запрещены постановлением ЦК ВКП(б) «О педагогических извращениях в системе Наркомпроса» (Сталин считал тесты буржуазным явлением). Были ликвидированы не только интеллектуальные, но и безобидные тесты успеваемости. Попытки возродить их в 70-х годах ни к чему не привели. В этой области наша наука и практика значительно отстали от зарубежной.
В школах развитых стран внедрение и совершенствование тестов шло быстрыми темпами. Широкое распространение получили диагностические тесты школьной успеваемости, использующие форму альтернативного выбора правильного ответа из нескольких правдоподобных, написание очень краткого ответа (заполнения пропусков), дописывания букв, цифр, слов, частей формул и т.п.
В настоящее время, с помощью этих несложных заданий удаётся накапливать значительный статистический материал, подвергать его математической обработке, получать объективные выводы в пределах тех задач, которые ставятся перед тестовой проверкой. Тесты печатаются в виде сборников, прилагаются к учебникам, распространяются на компьютерных дисках.
2.2. Тест как форма контроля знаний
Различают два метода контроля - субъективный и объективный. Субъективный метод контроля означает выявление, измерение и оценку знаний, умений, навыков, исходящую из личных представлений экзаменатора. Этот метод оценки знаний пригоден для итогового контроля, так как не обладает необходимой точностью и воспроизводимостью результатов.
Под объективным контролем подразумевают контроль, который обладает необходимой точностью, воспроизводимостью результатов. Инструментом, который позволяет объективно оценивать качество усвоения, является критериально-ориентировочный тест, сочетающий в себе контрольное задание и эталон, по которому можно судить по качеству усвоения. Однако, как свидетельствует реальная практика, не всегда удается достичь достаточной степени объективности и оперативности контроля в обучении. Вследствие этого, часто снижается представление об учебной деятельности учащихся.
Для оперативного контроля знаний и умений традиционно используются дидактические материалы - специально подобранные и систематизированные упражнения. Планируемые результаты, заданные в программе в виде конкретных требований к знаниям и умениям учащихся позволяет использовать такую форму контроля, как тесты.
Тест принципиально отличается от привычного контроля знаний тем, что к нему (заданию) заранее приготовлен эталон, с которым сравнивают ответ студента. Эталон необходим для точного определения степени усвоения студентом содержания обучения, которая характеризуется коэффициентом усвоения, подсчитываемым по формуле:
где е - число операций теста, выполненных студентом правильно,
р - общее число операций в тесте.
Тесты являются наиболее эффективной и объективной формой оценивания знаний, умений и навыков, позволяющей выявлять не только уровень учебных достижений, но и структуру знаний, степень ее отклонения от нормы по профилю ответов учащихся на тестовые задания. Тенденции усиления связи контроля и обучения приводят к переосмыслению роли контрольно–оценочной системы в образовании: контроль, оценка и обучение рассматриваются как взаимосвязанные и взаимопроникающие составляющие единого образовательного процесса. Если задания теста подобраны по нарастанию трудности и достаточно полно отображают планируемую содержательную структуру изучаемого и контролируемого материала, то возможно ранжировать школьников по уровням подготовленности: чем меньше пробелов в ответах ученика на тестовые задания, тем лучше структура его знаний; чем выше его тестовый балл, тем выше качество его подготовленности.
Вместе с тем результаты тестового контроля позволяют оценить и качество работы педагога: если тестовый балл в основном отражает способности и степень прилежания учащегося, то структура знаний в значительной степени характеризует особенности организации учебного процесса (умение преподавателя правильно выстроить программу обучения, доступно ее изложить, использовать приемы индивидуализации обучения и др.). Наиболее быстрыми для проверки и оценивания являются задания с выбором ответа из нескольких предложенных вариантов. Быстро выполнившим задания можно предложить дать более подробное обоснование выбора того или иного ответа. Важно выяснить, почему каждый учащийся выбрал именно этот ответ, в чем он был прав или ошибался, каких знаний ему не хватило для правильного ответа. В процессе такой работы знания учащихся углубляются, исчезает психологическое напряжение при работе с тестом, возникают потребность в добывании знаний, желание пройти следующее тестирование с достижением ожидаемого результата. При периодическом использовании различных видов такого контроля появляется возможность сопоставлять результаты, он может явиться основой динамического мониторинга учебных достижений школьников и индивидуализации обучения.
Можно выделить несколько видов тестировния:
· Входное
· Обучающее
· Диагностическое
· Независимое тематическое
· Репетиционное
· Итоговое
В условиях личностно ориентированной и развивающей педагогики входное тестирование помогает отказаться от ориентации на среднего обучаемого и ввести элементы индивидуализации в учебный процесс. Входные тесты предназначены для выявления уровня владения базовыми знаниями, необходимыми для усвоения нового материала, построения корректирующей программы педагогических воздействий для наиболее слабых учащихся, для тех, кто еще не готов изучать новый материал. Такие тесты обычно выстраиваются по логике критериально–ориентированного подхода, допускают развернутую содержательную интерпретацию результатов учащихся, позволяющую планировать индивидуальные корректирующие траектории обучения слабых учеников, нацелены на построение образовательных траекторий индивидуального обучения сильных.
Обучающее тестирование может широко использоваться учителями с применением авторских тестов наравне с традиционным опросом или при комбинированном опросе, а также при фронтальных экспресс–проверках по отдельным разделам учебных дисциплин для выявления степени усвоения содержания раздела или отдельной темы учебной дисциплины. Такое тестирование выполняет ряд функций: учащемуся дает информацию об уровне усвоения учебного материала и усиливает его мотивацию обучения; учителю предоставляет информацию о структурированности знаний учеников и развивает его навыки использования тестов в образовательной практике; создает более благоприятные и психологически комфортные условия при обучении и контроле.
Диагностическое тестирование предназначено для установления причин неправильного выполнения учащимися заданий корректирующего теста и отслеживания отдельных этапов их выполнения, выявления затруднений учащихся при изучении отдельных тем, разделов или основных положений изучаемой дисциплины. Диагностические тесты могут быть сконструированы учителями с учетом тех целей и задач, которые они ставят в учебном процессе. Повышению эффективности текущего контроля способствуют измерители, предназначенные для выявления пробелов в изучаемом материале и дополняемые специальными диагностическими тестами, позволяющими установить причину неправильного выполнения каждого задания теста. В том случае, если диагностические тесты сопровождаются системными средствами инструментального обеспечения процесса контроля, они превращаются в эффективное средство формирования практических навыков самоконтроля и самокоррекции у учеников. При диагностике центр внимания учителя смещается на обеспечение обратной связи от ученика к учителю. Однако на сегодняшний день в нашей стране практически нет готовых диагностических тестов, что существенно снижает эффективность работы педагога по индивидуализации учебного процесса в условиях массового обучения. Решение вопроса сопряжено с существованием ряда проблем использования педагогических измерений в образовательной практике: заданием предмета измерений, конструированием средств измерений, созданием шкалы и единиц измерения, нахождением нулевой точки отсчета результатов.
Тематическое независимое тестирование открывает новые возможности самоконтроля и может проводиться по заявкам учителей школ силами служб тестирования или региональных диагностических центров. Специально созданные тесты совместно с программно–инструментальными средствами, компьютерной технологией обработки результатов тестирования, научно обоснованными методами шкалирования и оценивания позволяют разгрузить преподавателей и обеспечить субъектов образовательного процесса возможностями самоконтроля. Такие тестовые материалы разрабатываются методистами центров тестирования совместно с учителями на основе имеющегося банка калиброванных по трудности тестовых заданий. За основу берутся тестовые задания по контролируемой теме. К таким контрольно–оценочным материалам предъявляются менее жесткие требования по точности измерений, чем для итоговой аттестации, а основной акцент делается на реализацию обучающей и развивающей функций контроля. Совместная работа учеников и педагогов по анализу результатов внешнего тестирования создает благоприятные условия для сотрудничества. Более того, тематическое тестирование в большей степени необходимо учителю для диагностики усвоения учащимися достаточно большого объема учебного материала, анализа собственной деятельности и корректировки своих квалиметрических навыков. При тематическом тестировании основные нормы, требования и технологии аттестационного тестирования должны максимально соблюдаться, так как использование одной и той же технологии способствует адаптации учащихся к контролю. Многократное применение одних и тех же технологий тестирования на всех этапах обучения помогает учащимся приобретать опыт для прохождения ЕГЭ=.
Еще одной из форм подготовки учащихся к итоговой аттестации является репетиционное тестирование по стандартизированным тестам и технологиям. Оно, как правило, проводится по сигнальным образцам тестов текущего года, предоставляемым Центром тестирования в феврале—марте каждого года. Это необходимо для того, чтобы учащиеся смогли ознакомиться с уровнем трудности заданий, структурой тестов, особенностями используемых тестовых форм, объемом контролируемого содержания, освоили методику предъявления ответов на задания теста, получили навык работы при отсутствии учителя–предметника и др.
Итоговые тесты занимают особое место в контрольно–оценочных системах, потому что результаты итогового тестирования используются для принятия определенных управленческих решений, связанных с выставлением итоговых баллов, аттестацией либо с переводом учащихся на очередную ступень обучения. Целью итогового тестирования является оценка результатов учебной деятельности после освоения всей программы курса, когда устанавливается соответствие между уровнем учебных достижений и требованиями образовательных стандартов. Такое тестирование проводится стандартизированными тестами и процедурами, обладающими необходимыми свойствами педагогических измерителей: обоснованностью, объективностью и сопоставимостью результатов по единой шкале оценок. Обоснованность достигается репрезентативным отображением требований стандартов в содержании тестов за счет включения достаточно большого числа заданий. Объективность обусловлена одинаковыми условиями контроля для всех учащихся (одинаковые по содержанию и уровню трудности тесты; одинаковые время проведения и время работы; дистанцированность контроля от учителя–предметника; единые методы обработки бланков ответов, шкалирования и оценивания результатов). В таких условиях тестовые баллы всех участников обладают одними и теми же свойствами, а следовательно, сопоставимостью, являющейся одним из существенных преимуществ тестового контроля.
Перечисленные выше формы тестового контроля не являются исчерпывающими, не должны в учебном процессе полностью заменять традиционные формы опроса, их виды и объемы должны органически дополнять традиционный контроль. Тестирование не отменяет и не заменяет педагогический опыт и индивидуальный вклад каждого педагога, а лишь помогает преподавателям эффективно организовать систематический, многоступенчатый контрольно–оценочный процесс и обеспечить таким путем условия для повышения качества контроля и образования. Разумное сочетание традиционного контроля и тестирования является одним из факторов активизации познавательной деятельности учеников и накопления данных для мониторинговых исследований качества образовательного процесса.
2.3. Виды тестов
Существуют разные виды тестов:
1. Открытая форма. Задания в открытой форме требуют ответа, сформулированного самим обучаемым. Ответы могут быть свободными или с ограничениями на ответ.
2. Закрытая форма. Наиболее часто используется на практике. Состоит из двух частей: основная часть, содержащая утверждение или вопрос, и варианты выбора или некоторое количество возможных ответов, из которых выбирается один правильный.
3. Тест на установление соответствия. Тестируемому предъявляются две группы элементов и ему необходимо связать каждый элемент первой группы с одним или несколькими элементами второй группы. Количество элементов во второй группе должно быть не меньше, чем в первой, для усложнения задания.
4. Тест на установление правильной последовательности. В таких заданиях требуется определить порядок следования предложенных объектов (символов, формул, рисунков, смыслового текста).
5. Тест с многозначным ответом. В вариантах ответа может быть верный ответ в разных видах. Либо среди ответов может не быть верных ответов. Тогда в результате каждому номеру заданий должны быть выставлены номера правильных ответов или прочерк.
6. Тесты на дополнение. В этих тестах задания оформляются с пропущенными словами или символами. Пропущенное место должно быть заполнено учащимися. Такие тесты полезны при изучении алгоритмов.
7. Тесты идентификации. В них используются графические объекты или аналитические описания.
8. Альтернативный тест. Представляет собой вопрос, допускающий только 2 варианта ответа: «да» или «нет».
Также различают следующие типы тестов:
1. Традиционный тест. Стандартизованный метод диагностики уровня и структуры подготовленности. В таком тесте все испытуемые отвечают на одни и те же задания, в одинаковое время, в одинаковых условиях, с одинаковыми правилами оценивания ответов.
2. Педагогический тест. Система заданий определенного содержания, возрастающей трудности, специфической формы, позволяющая качественно и эффективно измерить уровень и оценить структуру подготовленности учащихся. В педагогическом тесте задания располагаются по мере возрастания трудности - от самого легкого до самого трудного.
3. Гомогенный тест. Система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по одной учебной дисциплине.
4. Гетерогенный тест. Представляет собой систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся по нескольким учебным дисциплинам.
5. Интегративный тест. Тест, состоящий из системы заданий, отвечающих требованиям интегративного содержания, тестовой формы, возрастающей трудности заданий, нацеленных на обобщенную итоговую диагностику подготовленности выпускника ПТЗО, ВУЗа. Преимущество интегративных тестов перед гетерогенными заключается в большей содержательной информативности каждого задания и в меньшем числе самих заданий.
6. Адаптивный тест. Работает, как хороший экзаменатор. Сначала задаётся вопрос средней сложности, и полученный ответ немедленно оценивается. Если ответ правильный, то оценка возможностей тестируемого повышается. В этом случае задается более сложный вопрос. При успешном ответе, следующее задание подбирается более трудным, при неуспешном – легким.
В ходе выполнения тестов различных видов, формируются навыки сравнения объектов, сопоставления, соотнесения, представления объекта в разных формах. Они более интересны для студентов видами деятельности, для преподавателя – наполненностью содержания.
2.4 Требования к тестам
Тесты должны удовлетворять определенным требованиям, так как случайно подобранный набор заданий нельзя назвать тестом.
1. Надежность контрольного задания - это его способность, с достаточной для практики одинаковостью, характеризовать исследуемый в дидактических экспериментах, показатель, как заданий в целом, так и его частями. Или по-другому, тот же показатель одним и тем же заданиям, но в разные моменты времени.
Для пояснения понятия надежности контрольного задания можна отратиться к таблице умножения, убрав в ней правые части всех равенств и рассматривая оставшиеся выражения, как перечень контрольных заданий. Если группе испытуемых выдать некоторое число этих заданий и оценить их знания дважды: по ответам на задания из четных строк, то очевидно, у каждого из испытуемых получается приблизительно одни и те же оценки.
Также очевидно, что одинаковые оценки у каждого из испытуемых получатся и в том случае, если контроль знания таблицы умножения будет проведен по некоторой совокупности заданий дважды, но в разные моменты времени (например, через два дня). Приблизительное совпадение рядов оценок в обоих случаях как раз и говорит о надежности комплекта рассматриваемых контрольных заданий, то есть таблицы умножения.
2. Валидность (или адекватность целям проверки):
а) содержательная валидность теста, т.е. задание теста построено на основе только технических учебных элементах, которые изучались студентами и на той степени абстракции, на которой они излагались. По содержанию тест соответствует образовательному стандарту;
б) функциональная валидность теста, т.е. задания теста соответствуют выявленному уровню усвоения – уровню заданному образовательным стандартом. При составлении задания выделяются существенные и несущественные признаки элементов знаний. Существенные признаки закладываются в эталонный ответ. В другие ответы закладываются несущественные признаки с учетом характерных ошибок. Если учащиеся при работе с заданием знают и выделяют существенные признаки, а не формальные, то задание отвечает критерию валидности. Другими словами валидностью контрольного задания называется степень соответствия своему назначению.
К критериям валидности относятся ответы на вопросы типа: "Соответствует ли задание программы курса или его раздела?"; "Охватывает ли задание достаточно полно весь курс или его раздел?"; "Достаточна ли вероятность того, что если испытуемый успешно справился с рассматриваемым контрольным заданием, то он наверняка знает соответствующий материал в целом?" Другими словами, показатель валидности отвечает на вопрос: "а то ли, что сформулировано в назначении контрольного задания, измеряется с его помощью?"
Очевидно задание может быть надежным, но невалидным. Также очевидно, что имеется прямая связь между надежным и валидным: задание с низкой надежностью не может быть валидным.
Например, если с целью проверки знания учебного материала по педагогике, воспользоваться заданиями, составленными из определений, то оно, конечно, будет достаточно надежным: при проведении с ним серии экспериментов, описанных выше, будут получаться одинаковые оценки у большинства испытуемых. Но, очевидно, зарегистрированные при этом успехи не говорят о знании всего курса данного предмета. Следовательно, если целью контроля является проверка знаний всего курса педагогики, то валидность задания, составленного из произведений только определений, явно недостаточна.
С использованием понятий надежности и валидности контрольных заданий можно дать следующие определение:
Дидактическим тестом называется совокупность заданий, которые составлены в собирательной форме, предназначены для сравнительной оценки знаний, умений, навыков, способностей, умственного развития и удовлетворяют заданным требованиям надежности и валидности.
3. Определенность. После прочтения заданий каждый учащийся понимает, какие действия он должен выполнить, какие знания продемонстрировать. Если учащийся после прочтения задания правильно действует и отвечает менее 70% учащихся, то его необходимо проверить на определенность.
4. Простота. Формулировка заданий и ответы должны быть четкими и краткими. Показателем простоты является скорость выполнения задания.
5. Однозначность. Задание должно иметь единственный правильный ответ – эталон.
6. Равнотрудность. При составлении тестов в нескольких вариантах равнотрудность определяется стабильностью результатов по вопросам во всех вариантах одного и того же задания.
2.7. Применение тестов в ВУЗе
В последнее время в связи с введением в средней школе ГИА и ЕГЭ, тестирование получает все более широкое распространение и в высшей школе.
Преимуществами проведения тестового контроля студентов являются:
· возможность осуществления контроля над работой каждого студента;
· возможность регулярного систематичного проведения тестового контроля на всех этапах процесса обучения;
· наиболее полный охват тестовыми заданиями всех основных тем курса;
· обеспечение полной проверки знаний, умений и навыков студентов;
· объективность и независимость контроля;
· высокая разрешающая способность и точность оценки;
· учет специфических особенностей каждого учебного предмета за счет применения многообразия форм тестовых заданий;
· обеспечение функционирования внутренней обратной связи в процессе обучения;
· единство требований ко всем испытуемым, вне зависимости от их прошлых учебных достижений и др.
Наряду с множеством положительных моментов осуществления тестового контроля студентов при разработке контрольно-измерительных материалов преподаватели сталкиваются с рядом трудностей, в частности:
· с отсутствием единых утвержденных требований к оформлению и количеству тестовых заданий;
· с применением различных форм тестовых заданий, не применяющихся преподавателями ВУЗа до настоящего времени;
· с трудностью соблюдения рекомендуемого соотношения тестовых заданий различных форм;
· с отсутствием обучающих семинаров по методике тестового контроля для всех ведущих преподавателей;
· с трудностью составления требуемого количества тестовых заданий по некоторым дисциплинам;
· с нехваткой компьютеров, имеющих выход на программу формирования банка тестовых заданий и т.п.
В связи с тем, что тестовые задания разрабатываются с учетом разного уровня сложности, они могут применяться на разных уровнях подготовки студентов и не только для измерения уровня подготовленности, но и для реализации рейтинговой системы при оценке студентов, мониторинга учебного процесса, для организации адаптивного обучения и тестового контроля, а также дистанционного образования.