Предмет, цели и задачи психодиагностики как науки.
Предмет, цели и задачи психодиагностики как науки.
Психодиагностика - это раздел психологии, изучающий принципы, методологические приемы и средства построения и применения диагностических процедур с целью определения значения некоторых психологических феноменов, позволяющих установить диагноз.
Непосредственная цель диагностикисостоит в построении адекватного образаобъекта в границах (рамках) избранногопредмета – психологии.
Предмет психодиагностики
• Психологическая диагностика:– Изучает и использует способы распознавания и измерения
индивидуально-психологических особенностей человека (свойствличности, особенности интеллекта и др.).
– Являясь частью или видом экспериментирования, связана с разработкой и
применением инструментов психологического измерения.
• Предметом психодиагностикикак науки является достоверное,полное и обоснованноеизмерение конкретных свойств личности.
– «Обслуживает» предметные области психологии - определение наличиятого или иного свойства или качества индивида, степени еговыраженности и уровня развития;
– Проверка адекватности и истинности теоретико-психологическихпостроений различных психологических направлений.
• Психодиагностика строится на основе методов дифференциальнойпсихометрии, целью которой является разработка требований кизмерительным психодиагностическим методам.
– Адаптация методов, интерпретация получаемых данных, процедураразработки методов, разработка и применение математического аппаратадля анализа получаемых данных.
Психодиагностические задачи
• Частная диагностика.
– Обращение к психологу с запросом психодиагностического обследования(человек старается выполнять все инструкции без намерений «приукрасить»себя или фальсифицировать результаты).
• Ситуация экспертизы.
– Диагностика это своеобразный «экзамен» (человек может контролировать своеповедение и ответы для получения приемлемого для себя результата).
• Диагностические данные используются:
– а) другим специалистом для постановки непсихологического диагноза,например медицинского (психолог при этом не несет прямой ответственности);
– б) самим психологом для постановки психологического диагноза, ноиспользовать их будут специалисты другого профиля, например, ситуация привыявлении психологических причин школьной неуспеваемости;
– в) самим психологом-диагностом для разработки, например, коррекционныхпрограмм;
– г) самим обследуемым в целях саморазвития, коррекции своего поведения и т. д.
В этом случае психолог несет ответственность за качество проведенного
психодиагностического обследования и за список тех данных, которые он
считает возможным передать (важно соблюдать принцип «не навреди»).
Особенности психологических измерений. Структура психологической диагностики.
Определение типа шкалы
•Шкалаиеесистемаотношений
характеризуютсявидомпреобразований,
которыемогутбытьотнесеныкрезультатам
измерения.
–Еслинесоблюдатьэтоправило, тоструктура
шкалынарушится, аданныеизмерениянельзя
будетосмысленноинтерпретировать.
•Типшкалыоднозначноопределяет
совокупностьстатистическихметодов,
которыемогутбытьпримененыдляобработки
данныхизмерения.
•Степеньструктурнойсложностишкалы.
–Нулеваяразмерность, одномерная, многомерная.
Три характеристики теста
1. Психологическийтестэтообразец
поведения.
2. Образецповеденияполученв
стандартныхусловиях.
3. Дляполученияколичественной
информацииотобразцаповедения
Этапы стандартизации теста
•Разработкаединообразнойпроцедурыпроведения
тестадляполучениясравнимыхснормой
(критериями) результатов.
•Разработкаединообразнойметодикиоценки
выполнениятеста.
•Определениенормвыполнениятестадля
сопоставленияснимипоказателей, полученныхв
результатеобработкиданныхтестирования.
•Описанияиоценкиосуществляютсянаоснове
использованияметодовстатистики.
–Статистикаэтоопределеннаямера, вычисляемаяиз
отобранныхобразцов–выборки.
19.Основания (предположения) психологического тестирования.
Особенности тестов
Тестызависятотучетаивыборамногихаспектов:
•Измеряемоекачество:
–свойстволичности, интеллект, мотивацияидр.
•Способизмерения:
–Нормативное, критериальноеидр.
•Типтребуемогоповедения:
–ответнавопрос, выполнениезадания, рассказ…
•Содержание.
•Вычислениеиинтерпретация.
•Психометрическиекачества:
–надежность, валидностьидр.
Тестировании и оценке I
• 1. Психологическиеособенностии
состояниясуществуют.
• 2. Психологическиеособенностии
состояниямогутбытьизмереныи
выраженыколичественно.
• 3. Оценкаможетдатьответынаважные
жизненныевопросы.
• 4. Оценкаможетточноуказатьявления,
которыетребуютдальнейшеговнимания
илиизучения.
Тестировании и оценке II
• 5. Тестовоеповедениепредсказываетвне
тестовоеповедение.
• 6. Текущееобразцовоеповедение
предсказываетбудущееповедение.
• 7. Тестированиеиоценкамогутбыть
произведеныбеспристрастнои
объективнойформе.
• 8. Тестированиеиоценкаобщественнополезны.
Средства самоотчета
• Субъект описывает свои чувства, отношения, мнения или интересы.
• Многие личностные опросники, такие как MMPI или 16PF основаны на самоотчете.
• Клинические психологи включают средства самоотчета в качестве составной части первичного обследования предъявляемых клиентов.
• Самоотчеты часто подвержены само-цензуре.
– Люди знают, что их ответы измеряются и хотят выглядеть в хорошем свете (склонность заботиться о собственных интересах).
• Часто включают пункты для определения того, в какой степени люди дают социально предпочтительные ответы.
Основные типы тестов
• Тесты интеллекта: оценка интеллекта, измерение общего потенциала обучения.
• Тесты способностей: оценка одаренности измерение потенциала овладения специальной областью умений.
• Тесты достижений: оценка уровня достижений, измерение образованности и овладения специальной областью умений.
• Тесты на креативность: оценка способности к творчеству.
• Личностные тесты: оценка качеств и характерных особенностей личности и поведения человека.
• Опросники по интересам: оценка предпочтений деятельности, помощь в определении интересов человека, выборе профессии или области обучения.
• Поведенческие тесты: измерение поведения и его происхождения/последствий.
• Нейропсихологические тесты: измерение когнитивных, сенсорных, перцептивных и моторных функций.
Требования к разработчикам и пользователям тестовых методик. Профессионально – этические критерии работы психодиагноста с испытуемым.
1. Требования к разработчикам и пользователям тестовых методик
Принципы социальной нравственности - закреплены в нормах международных этических стандартов, принятых в работе психологов:
• Ответственности – исследователь отвечает за достоверность и конфиденциальность полученной информации.
• Компетенции – знание основных практических процедур психодиагностики и правильное их использование.
• Этической и юридической правомочности использование полученной информации в рамках действующего законодательства.
• Квалифицированной пропаганды психологии.
• Конфиденциальности – неразглашение сведений об испытуемых.
Принципы социальной нравственности - закреплены в нормах международных этических стандартов, принятых в работе психологов:
• Благополучия испытуемого – испытуемому не должен быть нанесен вред.
• Профессиональной кооперации – обмен психологической информацией.
• Информирования клиента о целях обследования.
• Морально-позитивного эффекта – повышение настроения испытуемого.
• Гражданственности и патриотизма.
Требования к авторам и издателям психодиагностических методик
1. Методики нельзя выпускать для практического применения преждевременно, не получив подтверждения их удовлетворительных психометрических характеристик.
– Это устанавливается в процессе достаточно большого числа теоретико-экспериментальных исследований.
2. При рекламе методики недопустимы какие-либо заявления о ее достоинствах, если для них нет достаточных объективных оснований.
3. Авторы методик должны составлять руководство по использованию, дающее полную информацию относительно:
– процедуры проведения,
– способов анализа и оценки результатов,
– сведения о всех параметрах методики, позволяющие оценить ее достоинства.
4. Авторы методик должны периодически проверять их и рестандартизировать, чтоб предотвратить их устаревание
Валидность теста
• Это степень, в которой он измеряет то, для чего он предназначен.
– Валидность – правильность, верность, обоснованность.
– Валидность не единственная мера = существует много возможностей для теста быть успешным или неуспешным.
• Валидность – степень обоснованности измерения психологических качеств, свойств, особенностей, признаков и т.п
Виды валидности
• Концептуальная (теоретическое обоснование возможности измерения исследуемого свойства с помощью данного психодиагностического средства или метода).
• Содержательная (характеризуется степенью представленности в заданиях методики содержания измеряемой области психических функций).
– Тест должен охватывать всю область изучаемого поведения.
• Конструктная (определяется тем насколько результаты теста могут быть рассмотрены в качестве меры исследуемого психологического конструкта (фактора или свойства).
• Операционная– отражает (в модельном плане) степень представленности реальных операционных условий психической деятельности в конкретных экспериментальных операциях, выполняемых испытуемыми в заданиях психодиагностической методики.
• Эмпирическая– совокупность сравнительных характеристик теста, полученная статистическими способами оценивания.
Надежность теста
• Оценки одного и того же человека по одному и тому же тесту, предъявленному дважды, будут отличны и похожи.
• Надежность теста это характеристика психодиагностической методики, отражающая точность психодиагностических измерений, а также устойчивость или стабильность результатов, полученных при помощи данной методики к действию посторонних случайных факторов.
• Надежность- это та степень, в какой можно полагаться на тест в достоверности измерения = мера устойчивости/вариативности при изменении обстоятельств или получении различных наборов одинаковых данных.
Основная задача теста
• Получить значение истинного балла (T) i-го испытуемого исходя из наблюдаемого результата
(X), с учётом случайной ошибки измерения (E).
• Отсюда вытекает основной постулат классической теории тестирования:
Xi=Ti+Ei
Поскольку в реальном монометрическом тесте число заданий ограничено (не более 100), то оценка надежности теста всегда приблизительна.
Современные теории тестов
• В ответ на критику классической теории тестов был разработан ряд «современных» теорий, которые называются стохастическими или вероятностными.
• В них дополнительно вводятся два параметра:
– способность испытуемого и
– трудность задания теста.
• Эти параметры рассматриваются как латентные переменные, о которых делают выводы на основе наблюдаемых при тестировании реакций.
– Латентными называются положительные и отрицательные качества, не поддающиеся непосредственному измерению.
• Примерами являются: «подготовленность студентов», «знаниеучебной дисциплины», «способность понимать», «интеллектуальное развитие» и многое другое.
Предположения теории ответов на вопросы (ItemResponseTheory - IRT)
• Одномерность теста: только одна переменная измеряется данным набором заданий.
• Локальная независимость: ответы испытуемого на любую пару заданий статистически независимы.
• Характеристическая функция задания отражает истинную связь между ненаблюдаемыми переменными (уровнем подготовленности) и наблюдаемыми (ответами на задание).
• Модель измерения определяется математическим выражением для характеристической функции задания.
• Предположения о характеристиках заданий,которые влияют на выполнение задания
испытуемыми.
§ Цель IRT – это проведение высококачественных педагогических измерений уровня подготовленности испытуемых и уровня трудности заданий, куда входит поиск подходящих прогностических моделей и проведение расчётов пригодности модели для имеющихся данных.
§ Задачи IRT вытекают из этой цели и сводятся к разработке таких методов измерения, которые позволяют получить наилучшие (оптимальные) параметрические оценки уровня подготовленности испытуемых и оценки трудности заданий на основе выборочных статистик и других эмпирических данных.
Преимущества IRT
• Оценки уровня подготовленности испытуемых инварианты относительно тестовых заданий,
– по результатам выполнения которых они получены.
• Оценки трудности тестовых заданий инвариантны относительно контингента испытуемых,
– по результатам тестирования которых они получены.
• Ошибка измерения оценивается индивидуально для каждого испытуемого и каждого задания.
• Все параметры заданий и испытуемых находятся на единой шкале.
– Имеется общая шкала (логитов/пробитов) для измерения уровня
подготовленности испытуемых и уровня трудности заданий, эта шкала является интервальной.
• Возможен анализ влияния дополнительных факторов на оценки параметров заданий и мер испытуемых.
• Разработаны методы решения специфических проблем тестирования.
• Теория компьютерного адаптивного тестирования базируется на IRT.
Недостатки IRT
• Игнорирование проблемы валидности - способность изначально должна быть согласована со шкалой интервалов.
• Теория применима к факторно простым тестам (одномерность).
– В психологической практике практически не наблюдается случаев, когда ответы на задания теста были бы обусловлены лишь одним фактором.
– Даже при тестировании общего интеллекта модели IRT плохо неприменимы.
• Для того чтобы получить надежную и не зависимую от испытуемых шкалу свойств, требуется провести тестирование большой выборки (не менее 1000 испытуемых).
• Тестирование достижений показывает, что существуют значительные расхождения между предсказаниями модели и эмпирическими данными.
• Шкалирование способно привести к образованию бессмысленных шкал.
– Например, попытка применить его модель к опроснику EPQ Айзенка
породила смесь шкал N, Е, Р и L.
Перечень основныхнедостатковВ классической теории тестирования:
• Оценки уровня подготовленности испытуемых зависят от уровня трудности конкретного теста.
• Оценки трудности тестовых заданий зависят от уровня подготовленности конкретной выборки испытуемых.
• Шкала первичных баллов часто является порядковой и теория не показывает как повысить уровень шкалы.
• Методы оценивания надежности требуют существенных ограничений и дают искаженные результаты.
• Ошибка измерения является величиной постоянной для всех
испытуемых.
• Уровни подготовленности испытуемых и параметры заданий теста находятся на различных шкалах.
• Нет возможности решить специфические проблемы тестирования.
– Не подходит для компьютерного адаптивного тестирования.
– Невозможно предсказать исход выполнения данным испытуемым данного задания.
Надежность теста
Надежность теста - фундаментальная характеристика теста, которая показывает в какой степени стабильны результаты тестирования при неоднократном обследовании. Надежность теста может определяться путем повторного тестирования (через строго определенный отрезок времени) и вычисления коэффициента корреляции между результатами первого и повторного тестирования. Надежность теста может определяться и путем тестирования с помощью нескольких вариантов одного и того же теста, деления теста на две половины и т.д. Надежность результатов тестирования зависит не только от качества самого теста, но и от процедуры проведения тестирования (она должна быть абсолютно идентичной в первом и во втором случае), социально-психологической однородности выборки (н. т. будет различной для детей, мужчин, женщин, солдат первого года – службы, старослужащих солдат и т.д.). И может получиться, что будучи надежным для одной группы людей, тест окажется ненадежным для другой, результаты тестирования в последнем случае будут неверны. Таким образом, н.т., выражая степень неточности, возможность ошибки, возникающей неизбежно при любом тестировании, заставляет искать пути уменьшения этой ошибки, более конкретного, целеустремленного применения теста. Надежность лучших тестов составляет 0,8 - 0,9.
Надежность ретестовая — характеристика надежности психодиагностической методики, получаемая путем повторного обследования испытуемых с помощью одного и того же теста. Надежность в этом случае вычисляется по соответствию результатов первого и второго обследований или по сохранению ранговых мест испытуемых в выборке при ретесте. Коэффициент надежности (rt) соответствует коэффициенту корреляции между результатами таких обследований. При использовании интервальных шкал применяется коэффициент корреляции произведения моментов Пирсона. Для шкал порядка в качестве меры устойчивости к перетестированию может быть использован коэффициент ранговой корреляции Спирмена или Кэндалла.При характеристике Н. р. особое значение имеет временной интервал между первым и вторым обследованиями. С его увеличением показатели корреляции имеют тенденцию к снижению, существенно повышается вероятность воздействия посторонних факторов — могут наступить закономерные возрастные изменения измеряемых тестом свойств, произойти различные события, влияющие на состояние и особенности развития исследуемых качеств. По этой причине при определении Н. р. стараются выбирать непродолжительные временные интервалы (до нескольких месяцев), а при обследовании детей младшего возраста эти интервалы должны быть еще меньше, поскольку возрастные изменения и развитие в этом случае происходят еще быстрее.
Валидность теста
«валидность теста - понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает». Валидность свидетельствует о том, пригодна ли методика для измерения определённых качеств, особенностей и насколько эффективно она это делает. Наиболее распространённым способом нахождения теоретической валидности теста (методики) является конвергентная валидность, то есть сопоставление данной методики с авторитетными родственными методиками и доказательство значимых связей с ними.
Виды валидности
• Концептуальная (теоретическое обоснование возможности измерения исследуемого свойства с помощью данного психодиагностического средства или метода).
• Содержательная (характеризуется степенью представленности в заданиях методики содержания измеряемой области психических функций).
– Тест должен охватывать всю область изучаемого поведения.
• Конструктная (определяется тем насколько результаты теста могут быть рассмотрены в качестве меры исследуемого психологического конструкта (фактора или свойства).
• Операционная– отражает (в модельном плане) степень представленности реальных операционных условий психической деятельности в конкретных экспериментальных операциях, выполняемых испытуемыми в заданиях психодиагностической методики.
• Эмпирическая– совокупность сравнительных характеристик теста, полученная статистическими способами оценивания.
27.Общее понятие о достоверности тестовых данных.
Речь идет о сознательных или бессознательных искажениях, которые вносит в тестовые результаты сам испытуемый, руководствуясь в ходе теста особой мотивацией, отличающейся от той, которая присуща ему в реальном поведении. Способность теста защищать информацию от МОТИВАЦИОННЫХ ИСКАЖЕНИЙ и есть достоверность теста. Особенно, остро проблема достоверности стоит в случае тест-опросников, которые допускают больше свободы в выборе испытуемым любого варианта ответа.
Типичный прием обеспечения достоверности — наличие в тест-опросниках ШКАЛ ЛЖИ. Эти шкалы основываются главным образом на феномене СОЦИАЛЬНОЙ ЖЕЛАТЕЛЬНОСТИ — стремлении испытуемых давать в ходе тестирования социально одобряемую информацию. Если испытуемый набрал по шкале лжи балл выше критического, то его протокол объявляется недостоверным и ему предлагается либо выполнить данный тест еще раз более откровенно, либо выполнить другой тест. Многие более специфичные ловушки, направленные на измерение достоверности, часто входят как компонент в структуру конкретного теста, а иногда даже не подлежат разглашению как элемент ноу-хау (информационного изобретения) и профессиональной тайны, разделяемой разработчиками только с лицензированными пользователями методики, подписавшими особое лицензионное соглашение при приобретении теста.
Достоверность тестирования тесно связана со степенью доверительности общения, которую смог психолог установить с данным испытуемым. Здесь полезно различать две диагностические ситуации: консультативную (СИТУАЦИЯ КЛИЕНТА) и аттестационную (СИТУАЦИЯ ЭКСПЕРТИЗЫ). В первом случае испытуемый участвует в тестировании на добровольной основе и сам заинтересован получить рекомендации по результатам тестирования (как, например, в профориентационной консультации). Во втором случае тестирование проводится по инициативе педагога или администрации, психолога, родителей, т. е. других лиц, и эти другие больше заинтересованы в результатах, чем сам испытуемый.
Понятно, что в аттестационной ситуации вопрос о достоверности особенно актуален. И опросники, не снабженные шкалами лжи, использовать в таких ситуациях бесполезно. Наоборот, в ситуации клиента могут быть использованы такие методики, на которые испытуемый заведомо будет отвечать некорректно в ситуации экспертизы.
Оценки и статистика
• Измерения и оценки осуществляются на основе использования методов статистики.
– Статистика это определенная мера, вычисляемая из отобранных образцов – выборки.
• Статистический вывод дает возможность экстраполировать свойства выборки на всю генеральную совокупность, т.е. делать предсказания и заключения о психологических
свойствах (признаках) других образцов или выборок наблюдений.
– Выборка представляет собой набор образцов (наблюдений, поведения и др.), принадлежащих некоторой генеральной совокупности.
– Генеральная совокупность (популяция) представляет собой собрание всех возможных образцов (наблюдений), частью которых является выборка.
Параметрическая статистика
• Параметрическая статистика применяется в метрических - интервальной и более мощных шкалах.
– В каждой метрической шкале применяются определенные статистические методы.
• В ходе психологического исследования, связанного с применением статистики, проводится изучение качеств большого числа людей, для того чтобы сделать обобщения и типологические выводы относительно всей или части наблюдаемой генеральной совокупности.
– Поскольку изучить свойства всей популяции часто невозможно, то осуществляется работа с выборкой (частью популяции, группой), а выводы с учетом определенных процессуальных правил распространяются на всю генеральную совокупность.
– Таким образом, по свойствам относительно небольшой группы, получается знание о свойствах генеральной совокупности.
• Характеристики распределения генеральной совокупности называются параметрами, а характеристики выборочного распределения —оценками параметров.
– Для применения методов параметрической статистики осуществляется процедура определения вида статистического распределения эмпирических данных.
Исходные представления
• Сила интеллекта определяется качеством мозга и нервнойсистемы.
• Чем больше мозг, тем выше интеллект. (У женщин объеммозга меньше, чем у мужчин).
– 1 тест - измерение объема головы.
– 2 тест - измерение времени реакции на разные раздражители
– 3 тест - сенсорная чувствительность на звук и свет.
• Понятие тест впервые применил для быстрых инесложных проверок американский психолог ДжеймсКеттел, работавший у Ханта и Гальтона.
– Ввел термин «интеллектуальный тест» в 1890 году.
• Большинство определенийсогласны с тем, чтоинтеллект имеет отношение к взаимосвязаннымспособностям:
1. Обучение в процессе опыта.
2. Адаптация к окружению.
• Подумайте о человеке, у которого недостаточнолюбого из этих качеств, и вы сможете отобратьлюдей у которых, как кажется, недостаетинтеллекта.
• Отметьте, что очень мало формальных тестовинтеллекта требуют от субъектаосуществить любое из указанных двух действий!
Концепции интеллекта.
Теория Спирмана: g- фактор. Оказала наибольшее теоретическое влияние
Синдром саванта
• Чрезвычайный талант в одной области.
– Музыка, искусство, способности к счету и др.
• В остальном умственная отсталость.
Имеет ли IQ значение?
• Терман и Оден (1959) в течение 40 лет проследилиразвитие детей с ультра-высокими IQ ( > 140).
– Одаренные дети имели больший вес при рождении;начали раньше ходить, разговаривать и становитьсязрелыми; их общее здоровье было лучше; они получилибольше заслуг и больше денег.
– Однако, ни один из них не стал супер успешным, типаЭнштейна.
• Некоторые предположили, что положительныезаключения могут происходить благодарявлиянию отбора, поскольку первичный выбор былоснован на учительских оценках.
Одаренность
• Высокий IQ.• Особые способности:– математика, искусство, лидерство.• Может быть распознана в 18 месяцев.• Способность давать новые ответы• Вариативность решений.• Нацеленность на лучшее решение.
Концепция креативности
• Модель интеллекта Дж. Гилфорда.
• Конвергентное мышление (схождение)
– актуализируется когда человеку, решающемузадачу, надо на основе множества условийнайти единственно верное решение.
• Дивергентное мышление - идущее вразличных направлениях».
– Допускает варьирование путей решенияпроблемы, приводит к неожиданным выводам ирезультатам.
Два типа мышления
Конвергентное
• При решении задачифактический материал изразных источниковобъединяется вместе такимобразом, чтобы найти«правильный» ответ (наука,математика, технология).
• Это те задания, которыеиспользуются в тестахинтеллекта.
Дивергентное
• Задачей является широкотворческая разработка идейпобуждаемых стимулом(искусство и гуманитарныенауки).
• Тесты с открытым числомрешений, в частностисвязанные «использованиемобъектов».
Дивергентная креативность
• Способность формировать новые идеи:
– Осуществлять выход за пределы заданного,мыслить вширь и в разных направлениях,видеть необычные атрибуты объекта и др.
• Теория дивергентной креативности итестовые задания были первичноразработаны Дж. Гилфордом.
Эмоциональная креативность
• Способность влиять наструктуру и содержаниеэмоциональных синдромов.
• Генерирование новых идей вотношении эмоциональныхявлений.
• Первые теория и практическиезадания для тестирования былиразработаны Дж. Эвериллом.
• Для измерения эмоциональнойкреативности используютсяметодики типа опросников,основанных на самоотчете, ипродуктивные задания.
Результаты тестирования
• Включают в себя разнообразные ответы вколичестве от 1 до 9.
• После классификации смысла ответов экспертом-психологом по качественным отличиям между нимибыло выделено 17 общих смысловых категорий, вкоторые попадают различные ответы всехиспытуемых в выборке.
– Например, категория «книга испорчена» включает всебя ответы, связанные с разными повреждениямикниги
• вырванные листы, рисунки, грязь, запах и др.
– Категория «книга не нужна» включает в себя ответы,связанные с причинами ненужности
• нет времени для чтения,
• уже куплена новая книга и др.
41. Назначение и использование тестов достижений и готовности.
Тесты достижений
• Наряду с тестами интеллекта, специальных икомплексных способностей возник и еще один типтестов, широко применяемых в обучении – тестыдостижения.
• Эти тесты можно назвать и по-другому– тесты объективного контроля успешности
• школьной, профессиональной, спортивной.
• В отличие от тестов интеллекта, тесты достиженийотражают не столько влияние накопленногоопыта, сколько влияние специальных программобучения, профессиональной и другойподготовки на эффективность решенияспециальных заданий.
Тесты достижений в России
• Первые исследования и публикации – начало 80-х годов прошлоговека.
• 90-е – централизованное тестирование – методики разработкизаданий и тестов, технология бланкового и компьютерноготестирования.
– Зарождение идеи ЕГЭ (дискуссии «за» и «против»).
• С 2001 г. – эксперимент по единому государственному экзамену
– Федеральный институт педагогических измерений - внедрение тестов всреднюю школу, сборники тестов.
• Тестирование при аттестации вузов
– Центр тестирования профессионального образования (АСТ-центр) –лицензирование и аккредитация ВУЗов.
• Росаккредагенство. Проект Интернет-экзамен. Технологии массовогокомпьютерного тестирования.
• Программы подготовки тестологов
– ФЦТ, РУДН, МИСиС, АСТ-центр, МГППУ и др.
• 2009-2010 – переход на ЕГЭ.
42. Педагогические тесты: свойства, формы тестовых заданийи требования к ним.
Определения педагогического теста
• Аванесов В.С.
– Педагогический тест - система заданий возрастающей трудности, специфической формы, позволяющая качественно и эффективно измерить уровень и оценить структуру подготовленности учащихся.
• Челышкова М.Б.
– Педагогический тест - система тестовых заданий, упорядоченных в рамках определенной стратегии предъявления и обеспечивающих информационность оценок уровня и качества подготовки испытуемых.
• Анастази А.
– Тесты достижения предназначены для измерения воздействия теоретических и практических курсов обучения.
– Главное значение в тестах достижений придается тому, что конкретный человек способен делать в настоящий момент.
Требования к тестам
• Технологичность и экономичность с точки зрения изготовления, применения, обработки и анализа результатов.
• Универсальность, т.е. применимость для различного типа школ, не должны зависеть от конкретной программы и учебника.
• Валидность. Тесты должны с определенной заранее известной точностью удовлетворять поставленной цели тестирования.
– Например, достижение требований стандарта образования.
• Надежность. Должна быть заранее определена точность оценок по результатам тестирования.
• Легитимность. Тесты не должны противоречить существующим законам и нормативам.
Проведение тестирования и анализ
• Формирование репрезентативной выборки.
• Применение серии одинаковых тестов к большому числу учащихся.
• Статистическая обработка результатов.
• Определение подходов к интерпретации результатов (эталон оценки).
• Анализ результатов.
Требования к тестовым заданиям
• Валидность – измеряет именно то, что указано, например - соответствие учебной программе, не требовать знаний и умений, кроме тех, что намечены к проверке.
• Объективность – минимально - однозначность ответа, – проблема экспертной проверки.
• Надежность – стабильно дифференцировать сильных и слабых учащихся.
• Эффективность – информационность теста должна быть связана с его длиной.
• Приемлемость – принят всеми заинтересованными сторонами как отражение проверяемых знаний или способностей.
Характеристики тестовых заданий
• Форма заданий в соответствии с типом ответа.
• Авторы.
• Проверяемое содержание.
• Проверяемое умение (деятельность).
• Уровень сложности задания (экспертный).
• Максимальный балл.
• Способ представления информации (доп.).
• Время выполнения задания.
• Статистические характеристики.
Формы тестовых заданий С закрытым ответом:
• с выбором ответа,
• Да/Нет,
• на установление соответствия,
• на установление последовательности,
• на множественный выбор,
• (выбор лучшего ответа).
Со свободно- конструированным ответом:
• с кратким ответом (слово или число).
• с развернутым ответом.
Состав:
• Текст задания.
• Инструкция по выполнению.
• Критерии оценивания.
43. Зарубежные тесты знаний и готовности.
Тесты по итогам обучения
• Как правило, тесты по итогам обучения (их также называют тестами знаний) оценивают степень
информированности или сформированности навыков выпускников.
• Эти тесты в значительной степени ориентированы на проверку фактических знаний и навыков по
отдельному предмету или группе предметов.
• Они призваны оценить и количество, и качество усвоенных знаний в соответствии с той программой, по которой изучался данный предмет.
• Поэтому составители таких тестов стараются включать туда задания, проверяющие усвоение
максимального числа элементов этих знаний на разных уровнях.
Тесты знаний
• Проверяют знания и навыки, которые можно получить за относительно короткий промежуток времени.
• Такие тесты применяются главным образом, чтобы оценить результативность обучения по одному курсу или по целостной программе, а также, чтобы проверить очень специализированную подготовку.
• Очевидно также, что к «тестам знаний» можно подготовиться, заучивая факты и тренируя
стандартные алгоритмы действий.
Примеры тестов знаний
Примерами тестов знаний, используемых в США, могут служить:
• SAT II – тест, используемый на какой уровень обучения по конкретному предмету может быть определен студент послезачисления;
• AdvancedPlacement (AP) – тест, который позволяет школьникам получать «зачеты» по курсам из университетской программы;
• GRE Предметные тесты – специальный тест по конкретному предмету для поступления в аспирантуру по соответствующей специальности.
Особенности тестов знаний
• Контрольно-измерительные материалы (тестовые задания) для таких тестов довольно легко конструируются
– как в виде заданий с мно<