Анализ характеристик заданий теста
Анализ теста по математике в рамках IRT
Данный тест по математике состоит из 26 вопросов, разделенных на 3 части: А, В и С (10, 11 и 5 заданий в каждой части соответственно). Части А и В оценивались дихотомически, а часть С – политомически. Тест выполнили 1339 учеников. Распределение баллов за тест представлено на рисунке 1, общие сведения по тесту в таблице 1.
Рис.1. Распределение общего балла за тест
Таблица 1 Общие характеристики заданий и испытуемых
Среднее | Ст.откл. | Max | Min | |||
Характеристики испытуемых | Балл за тест | 14.0 | 6.1 | 36.0 | 1.0 | |
Подготовленность | .13 | 1.81 | 5.47 | -5.46 | ||
ERROR | .56 | .08 | 1.17 | .37 | ||
INFIT | MNSQ | .99 | .43 | 4.40 | .15 | |
ZSTD | .0 | 1.0 | 4.5 | -2.9 | ||
OUTFIT | MNSQ | 1.01 | 1.26 | 9.90 | .07 | |
ZSTD | .2 | .7 | 6.7 | -.8 | ||
Характеристики заданий | total score | 719.1 | 370.1 | 1310.0 | 107.0 | |
Трудность | .00 | 2.48 | 4.31 | -5.28 | ||
ERROR | .08 | .03 | .21 | .05 | ||
INFIT | MNSQ | .99 | .11 | 1.24 | .76 | |
ZSTD | -.1 | 2.4 | 5.2 | -5.0 | ||
OUTFIT | MNSQ | 1.08 | .36 | 2.05 | .48 | |
ZSTD | .5 | 2.4 | 6.2 | -3.8 | ||
Дискриминативность | 0,5 | |||||
Надежность теста (КТТ) | 0,9 |
Средний балл за тест составил 14 баллов. Максимальный балл 36 и минимальный 1.
Тестируемые имеют средний уровень подготовленности (по шкале логитов составляет 0,13). Есть как учащиеся с высоким уровнем подготовленности (5.47 логитов), так и те, кто имеет проблемы с изучением математики (уровень подготовленности -5,46 логитов).
Ошибка измерения в среднем составила 0,56 (немного большая, лучше бы до 0,3)
В целом согласие с моделью хорошее. Об этом говорит не взвешенное и взвешенное значение статистик mnsq. Они находятся в пределах единицы. Однако их максимальные и минимальные значения говорят о том, что не все испытуемые находятся в согласии с моделью.
В среднем на 1 задание отвечали 719 людей. Согласие заданий теста с моделью хорошее. Взвешенные и невзвешенные статистики mnsq находятся в пределах единицы. Максимальные и минимальные значения mnsq говорят о том, что есть тестовые задания, которые не находятся в согласии с моделью. Максимальная ошибка достигает 0,21, что подтверждает хорошее согласие заданий с моделью.
Средняя трудность заданий равна 0 (как и должно быть). Средняя ошибка заданий теста (0,08) меньше ошибки испытуемых, так как на 1 задание приходится больше человек, чем на 1 испытуемого - заданий. Вот тут будем что-то писать про то что центрирование не совпадает??
Далее проведем более подробный анализ заданий и профилей испытуемых.
Анализ характеристик заданий теста
В таблице 2 представлены характеристики всех заданий и согласие каждого задания с моделью.
Таблица 2. Характеристики тестовых заданий и согласия с моделью
Характеристики заданий | Согласие с моделью | |||||||
№ | Общий результат | Дискрими-нативность | Трудность | S.E | OUTFIT | PT-MEASURE | EXACT | MATCH |
MNSQ | ZSTD | MNSQ | ZSTD | |||||
A1 | .48 | -2.71 | .10 | .92 | -1.3 | 1.26 | 1.3 | |
A2 | .29 | -5.28 | .21 | .97 | -.1 | .76 | -.8 | |
A3 | .45 | -2.84 | .10 | .98 | -.3 | 1.12 | .7 | |
A4 | .51 | -.67 | .07 | 1.11 | 3.1 | 1.43 | 4.4 | |
A5 | .38 | -4.10 | .14 | .92 | -.8 | .95 | -.1 | |
A6 | .46 | -1.95 | .08 | 1.11 | 2.4 | 1.20 | 1.4 | |
A7 | .55 | -2.27 | .09 | .87 | -2.7 | .69 | -2.1 | |
A8 | .45 | -1.73 | .08 | 1.15 | 3.3 | 2.05 | 6.2 | |
A9 | .46 | -2.80 | .10 | .98 | -.3 | .95 | -.2 | |
A10 | .49 | -.84 | .07 | 1.15 | 4.3 | 1.27 | 2.7 | |
B1 | .58 | -.39 | .07 | .99 | -.3 | 1.06 | .8 | |
B2 | .54 | -.91 | .07 | 1.03 | .9 | 1.39 | 3.8 | |
B3 | .57 | 1.16 | .07 | .97 | -.8 | .94 | -.6 | |
B4 | .63 | -.65 | .07 | .84 | -5.0 | .83 | -2.0 | |
B5 | .53 | .41 | .07 | 1.11 | 3.2 | 1.10 | 1.2 | |
B6 | .58 | .31 | .07 | 1.00 | .0 | .92 | -1.0 | |
B7 | .60 | 1.34 | .07 | .88 | -3.3 | .76 | -2.6 | |
B8 | .60 | .52 | .07 | .92 | -2.3 | .99 | -.1 | |
B9 | .39 | 2.04 | .08 | 1.24 | 5.2 | 1.80 | 5.1 | |
B10 | .52 | 2.77 | .09 | .86 | -2.9 | .48 | -3.8 | |
B11 | .43 | 3.01 | .10 | .94 | -1.0 | 1.22 | 1.2 | |
C1 | .64 | 2.08 | .06 | .91 | -1.8 | .69 | -2.4 | |
C2 | .65 | 1.77 | .05 | .96 | -.8 | .92 | -.7 | |
C3 | .55 | 3.45 | .06 | .95 | -.7 | .79 | -1.3 | |
C4 | .31 | 3.96 | .08 | 1.16 | 1.0 | .70 | -.9 | |
C5 | .35 | 4.31 | .09 | .76 | -1.7 | 1.69 | 2.2 | |
Среднее | 719.1 | 0.5 | .00 | .08 | .99 | -.1 | 1.08 | .5 |
S.D. | 370.1 | 2.48 | .03 | .11 | 2.4 | .36 | 2.4 |
Тест содержит как очень трудные задания (С3-5, В11), так и очень простые (А2, 3, 5). Дискриминативность (коэф. корреляции) варьируется от 0,31 до 0,6; среднее значение 0,5, что говорит о том, что все задания и тест в целом обладают хорошей дифференцирующей способностью.
При исследовании согласия с моделью ответов испытуемых на каждое из заданий, было выявлено, что такие задания как А1, А4, А6, А8, А10, В2, В9, В11, С5 – плохо согласуются с моделью. В данных заданиях более чем на 20% больше вариации, чем это предсказывалось моделью. Хуже всего с моделью согласуется задание А8. Оно является достаточно легким (по шкале логитов -1,73) и относится к блоку A. Его выполнили 1034 человека из всей выборки.
Задание 19 (B9) -явялется достаточно сложным (2,04 логита). Выполнили 301 человек из 1339.
Задание 26-явялется очень сложным (4,31 логита). Выполнили только 107 человек из 1339.
Ошибка измерения данного задания немного увеличивается по сравнению с преыдущими (до 0,1), так как на на него приходится меньше решающих детей.
Задания 14,20,7,17 ,22 и т.д. плохо соотносятся с моделью тоже. В наблюдаемых данных меньше вариации, чем это предсказывалось моделью. Нужно ли это писать?
На рисунке 2 изображена карта заданий теста.
Рисунок 2. Карта заданий
Данный рисунок подтверждает, что тест обладает хорошей дифференцирующей способностью: испутыемые равномерно распределились по заданиям разного уровня трудности. Так же из рисунка видно, что тест построен по принципу возрастающей трудности, задания части А проще, нежели задания части В, которые в свою очередь легче заданий части С. Что еще мы можем тут сказать? Наверное что-то про центрирование тоже надо
Дальше характеристические кривые всех заданий и отдельно дерьмовых заданий + можно политомические отдельно.