История развития тестовдостижений
• Может быть прослежена с момента смены в Бостонскойшколе (1845) устной формы экзаменов на письменную.
• Основным достоинством новой формы экзаменационнойпроцедуры считается наличие однотипной ситуации для всехэкзаменующихся, позволяющей исключить элементы
случайности при опросе и субъективизм в оценках.
• В Америке тесты достижений используются при отборесотрудников на государственную службу уже с 1872 г., а с1883 г. их употребление становится регулярным ипостоянным.
• Наиболее значительная разработка элементов техникиконструирования тестов достижений выполнена в течениепервой мировой войны и сразу после нее.
• Тесты достижений относятся к наиболее многочисленнойгруппе психодиагностических методик по числуконкретных тестов и их разновидностей.
Тесты достижений и тестыготовности
• Предназначены для оценки успешности овладенияконкретными знаниями (общие и предметные).
• Широко используются при профессиональнойподготовке и отборе, а также в образовании– для контроля уровня подготовленности, оцениваниярезультатов обучения и качества образования.
• К ним относятся также современныепедагогические тестыили тесты академических
способностей:
– высоко надежные тесты разработанные в соответствии ссамыми тщательными психометрическими стандартами,
– активно используются для оценки знаний и готовности кдальнейшему образованию.
Международные тесты достижений
• Международный тест TOEFL на на знание английского какиностранного языка
– Стандартизованный тест на знание английского языка, сдача которогообязательна для не англоязычных иностранцев для поступления в вузыСША и Канады, а также Европы и Азии.
• Национальные программы тестирования
– США, Израиль, Австралия, …
• ACT (AmericanCollegeTesting)
– Стандартизированный тест для поступления в старшие классы илипоступления в колледжи в США.
• SAT (Scholastic Aptitude Tests)
– Стандартизованный тест для приема в высшие учебные заведения вСША.
• GRE (GraduateRecordExaminations)
– Тест, который необходимо сдавать для поступления в аспирантуру,магистратуру или иной последипломный курс в вузы США, Канады иряда других стран.
Тесты достижений в России
• Первые исследования и публикации – начало 80-х годов прошлоговека.
• 90-е – централизованное тестирование – методики разработкизаданий и тестов, технология бланкового и компьютерноготестирования.
– Зарождение идеи ЕГЭ (дискуссии «за» и «против»).
• С 2001 г. – эксперимент по единому государственному экзамену
– Федеральный институт педагогических измерений - внедрение тестов всреднюю школу, сборники тестов.
• Тестирование при аттестации вузов
– Центр тестирования профессионального образования (АСТ-центр) –лицензирование и аккредитация ВУЗов.
• Росаккредагенство. Проект Интернет-экзамен. Технологии массовогокомпьютерного тестирования.
• Программы подготовки тестологов
– ФЦТ, РУДН, МИСиС, АСТ-центр, МГППУ и др.
• 2009-2010 – переход на ЕГЭ.
42. Педагогические тесты: свойства, формы тестовых заданийи требования к ним.
Определения педагогического теста
• Аванесов В.С.
– Педагогический тест - система заданий возрастающей трудности, специфической формы, позволяющая качественно и эффективно измерить уровень и оценить структуру подготовленности учащихся.
• Челышкова М.Б.
– Педагогический тест - система тестовых заданий, упорядоченных в рамках определенной стратегии предъявления и обеспечивающих информационность оценок уровня и качества подготовки испытуемых.
• Анастази А.
– Тесты достижения предназначены для измерения воздействия теоретических и практических курсов обучения.
– Главное значение в тестах достижений придается тому, что конкретный человек способен делать в настоящий момент.
Требования к тестам
• Технологичность и экономичность с точки зрения изготовления, применения, обработки и анализа результатов.
• Универсальность, т.е. применимость для различного типа школ, не должны зависеть от конкретной программы и учебника.
• Валидность. Тесты должны с определенной заранее известной точностью удовлетворять поставленной цели тестирования.
– Например, достижение требований стандарта образования.
• Надежность. Должна быть заранее определена точность оценок по результатам тестирования.
• Легитимность. Тесты не должны противоречить существующим законам и нормативам.
Проведение тестирования и анализ
• Формирование репрезентативной выборки.
• Применение серии одинаковых тестов к большому числу учащихся.
• Статистическая обработка результатов.
• Определение подходов к интерпретации результатов (эталон оценки).
• Анализ результатов.
Требования к тестовым заданиям
• Валидность – измеряет именно то, что указано, например - соответствие учебной программе, не требовать знаний и умений, кроме тех, что намечены к проверке.
• Объективность – минимально - однозначность ответа, – проблема экспертной проверки.
• Надежность – стабильно дифференцировать сильных и слабых учащихся.
• Эффективность – информационность теста должна быть связана с его длиной.
• Приемлемость – принят всеми заинтересованными сторонами как отражение проверяемых знаний или способностей.
Характеристики тестовых заданий
• Форма заданий в соответствии с типом ответа.
• Авторы.
• Проверяемое содержание.
• Проверяемое умение (деятельность).
• Уровень сложности задания (экспертный).
• Максимальный балл.
• Способ представления информации (доп.).
• Время выполнения задания.
• Статистические характеристики.
Формы тестовых заданий С закрытым ответом:
• с выбором ответа,
• Да/Нет,
• на установление соответствия,
• на установление последовательности,
• на множественный выбор,
• (выбор лучшего ответа).
Со свободно- конструированным ответом:
• с кратким ответом (слово или число).
• с развернутым ответом.
Состав:
• Текст задания.
• Инструкция по выполнению.
• Критерии оценивания.
43. Зарубежные тесты знаний и готовности.
Тесты по итогам обучения
• Как правило, тесты по итогам обучения (их также называют тестами знаний) оценивают степень
информированности или сформированности навыков выпускников.
• Эти тесты в значительной степени ориентированы на проверку фактических знаний и навыков по
отдельному предмету или группе предметов.
• Они призваны оценить и количество, и качество усвоенных знаний в соответствии с той программой, по которой изучался данный предмет.
• Поэтому составители таких тестов стараются включать туда задания, проверяющие усвоение
максимального числа элементов этих знаний на разных уровнях.
Тесты знаний
• Проверяют знания и навыки, которые можно получить за относительно короткий промежуток времени.
• Такие тесты применяются главным образом, чтобы оценить результативность обучения по одному курсу или по целостной программе, а также, чтобы проверить очень специализированную подготовку.
• Очевидно также, что к «тестам знаний» можно подготовиться, заучивая факты и тренируя
стандартные алгоритмы действий.
Примеры тестов знаний
Примерами тестов знаний, используемых в США, могут служить:
• SAT II – тест, используемый на какой уровень обучения по конкретному предмету может быть определен студент послезачисления;
• AdvancedPlacement (AP) – тест, который позволяет школьникам получать «зачеты» по курсам из университетской программы;
• GRE Предметные тесты – специальный тест по конкретному предмету для поступления в аспирантуру по соответствующей специальности.
Особенности тестов знаний
• Контрольно-измерительные материалы (тестовые задания) для таких тестов довольно легко конструируются
– как в виде заданий с множественным выбором,
– так и в виде заданий (задач) с фиксированным ответом.
• В принципе не требуют от испытуемого сообразительности или креативности.
• Устроены по принципу проверки воспроизведения информации или проверки владения стандартными алгоритмами.
Тесты готовности
• Для прогностических целей используются так называемые тесты готовности (или тесты способностей).
• Они в большей степени призваны оценить работу человека «здесь и теперь» в некой определенной познавательной или психомоторной области.
• Они создаются таким образом, чтобы выяснить потенциальную способность человека в
специализированной деятельности и в условиях ограниченной информации.
Задачи тестов готовности
• Задача таких тестов не оценить его прошлые успехи, а составить картину о возможностях
его/её обучаемости в данной области.
• Понятно, что быстро подготовиться («натаскаться») к такому тесту трудно.
• Составители тестов готовности стараются выяснить состояние навыков, приобретенных
во многих областях за относительно длительные промежутки времени.
Примеры тестов готовности
В США используются следующие тесты готовности:
• SAT I – тест, используемый университетами при отборе абитуриентов на программы бакалавриата;
• GRE Общий – экзамен для поступления в аспирантуру по магистерским или докторским программам;
• GMAT – экзамен для поступления на обучение по программам MBA (мастер делового
администрирования).
44. Стандартизированные тесты для приема в ВУЗ и аспирантуру (SAT, GRE).
Стандартизированные тесты ВУЗов
• Тесты академических способностей - Scholastic AptitudeTests (SAT), GRE – высоконадежные
тесты разработанные в соответствии с самыми тщательными психометрическими стандартами.
• Состоят из вопросов и вариантов ответов к ним.
• Эталонная (референтная) группа нормы меняется каждый год:
– например эталонная группа для оценок 2003 года была основана на данных экзаменуемых в 1998-2001 годов,
– а эталонная группа для 2004 года - на данных экзаменуемых в 1999-2002 годов.
– По этой причине в зависимости от года одинаковая оценка может иметь (слегка) отличный процентиль.
SAT - ScholasticAptitudeTest
• Учебныйтестспособностей– Является набором тестов способностей к обучению.
• Совет колледжей США - 400 центров разработки тестов и проведения тестирования, около 2 млн. человек в год по миру.
• Это тест для абитуриентов и студентов младших курсов, решивших дальше учиться в вузах США и
Канады.
• Экзамен оценивает общее знание литературы, истории и математики.
– Колледжи, университеты и программы предоставления стипендий используют эти результаты академической успешности (баллы по экзамену SAT) для понимания того, насколько хорошо Вы подготовлены для продолжения обучения, а также помогают сравнивать академические достижения студентов из разных учебных заведений.
SAT бывает двух видов
• Проверка общих способностей мышления (SAT I, тест на мышление, рассуждение).
– Был создан для проверки математических способностей и умения словесно излагать свои мысли.
– SAT I включает вербальные и математические испытания, оценки которых суммируются для того, чтобы получить полный балл.
• Время - 3 ч 45 мин, с 2005 года – эссе.
• Проверка знаний по какому-либо конкретному предмету (SAT II, предметный тест).
– Имеет тесты в 12 предметных областях -
• 50 вопросов - 60 мин.
– В один день можно сдавать тест максимум по трем предметам.
– Но нельзя в один день сдавать SAT I и SAT II.
Тест SAT
• Математическая часть теста состоит из вопросов по алгебре, геометрии и арифметике, так что кроме умения логически рассуждать проверяется умение считать.
• Устная часть теста состоит из разделов:
– Аналогии - вопросы теста на знание значений слов и умение найти зависимость, т.е. провести аналогию, между парой слов.
– Завершение предложений - вопросы теста на знание значений слов и умение понимать логическую связь между различными элементами предложения.
– Критическое чтение - эти вопросы теста оценивают умение читать и осмысливать прочитанное.
Общийтест GRE (Graduate Record Examinations)
• Тест выпускных экзаменов в ВУЗе.
• Похож на SAT I, т.к. он был создан больше для проверки умения логически рассуждать, а не знаний в какой-то конкретной области.
• Для проверки последних существуют GRE Предметные тесты.
• Этот тест нужно сдать для поступления в аспирантуру в США (то есть на магистерские программы вузов).
• Этим тестом фактически подтверждается степень бакалавра.
• Тест GRE рассчитан на то, чтобы проверить знания и навыки, приобретенные за долгий промежуток времени, и предсказать дальнейшие успехи.
Общий Тест GRE
• GRE является стандартизированным компьютеризированным тестом и имеет 4 раздела:
– Вербальный: 30 вопросов, 30 минут;
– Количественный: 28 вопросов, 45 минут;
– Аналитический письменный: 2 аналитических письменных задания:
• 45-минут – задание «представление Вашей точки зрения по вопросу».
• 30-минут - задание «анализ аргумента».
– Исследовательский.
• Тест ограничен во времени и скорректирован по отношению к угадыванию.
• Тест «адаптирован для компьютера»: вопросы зависят от ответов.
45. Психометрические свойства тестов знаний. Зарубежный опыт и политика тестирования.
психометрические свойства теста - это свойства, обеспечивающие определенный стандарт качества для любой измерительной психодиагностической методики (ТЕСТА). Практически все современные авторы относят к числу П.С.Т. три свойства: НАДЕЖНОСТЬ, ВАЛИДНОСТЬ и РЕПРЕЗЕНТАТИВНОСТЬ. Некоторые авторы зачисляют в число свойств ДИСКРИМИНАТИВНОСТЬ (способность теста различать испытуемых), некоторые - ДОСТОВЕРНОСТЬ (способность теста сопротивляться ИСКАЖЕНИЯМ).
1. Всё ли можно брать из американского опыта?
• Тесты должны быть адаптированы в соответствии с требованиями учета межкультурных различий.
– Культуры разных стран сильно отличаются.
• Пример – четыре основных параметра измерения национальной культуры по Г.Хофстеде.
– Дистанция власти - PDI
• За результат отвечает сам человек или начальник. «Все люди равны , но некоторые из них равнее…»
– Индивидуализм / коллективизм - IDV.
• Отношение к своим и чужим по одной или разным шкалам ценностей.
– Маскулинность / феминность - MAS.
• Забота о себе или забота о других. Жить чтобы работать? или Работать чтобы жить?
– Избегание неопределенности – UAI.
• Что лучше: «Журавль в небе?» или «Синица в руках»?
2. Всё ли можно брать из американского опыта?
Политологи США признают, что
• дети богатейшей страны мира часто оказываются на последнем месте в знаниях
по математике и в заднем эшелоне — в области естествознания в сравнении со
своими ровесниками из других промышленно развитых государств,
• увеличивается число детей из малообеспеченных семей, которые просто-
напросто бросают школу
• значит, образовательная система больна.
Политика тестирования
• Вопрос о тестировании указывает на одно из больных мест американского образования:
– можно ли в такой обширной и разноликой стране, как США (или Россия), с ее резкими контрастами между богатыми и бедными, разработать тесты, которые учитывали бы все культурные и экономические различия учащихся, оценивая не только их достижения, но и
потенциальные способности к обучению?
• Многие аналитики отмечают, что поиск универсального способа тестирования относится к
числу тех близоруких благих намерений, которыми вымощена дорога в ад.
• Однако, других реальных альтернатив развитию массового общества пока нет.
46. Тесты для профориентации. Инвентарь интересов Стронга-Кэмпбелла. Типологический опросник Майерс-Бриггс.