Надежность и стандартная ошибка измерения
Один из аспектов применения коэффициента надежности связан с определением стандартной ошибки измерения. Для установления связи между стандартной ошибкой измерения и надежностью теста необходимо преобразовать формулу (5.71):
После преобразования формулы относительно Sj? получится выражение
где Sx— стандартное отклонение по распределению индивидуальных баллов; гн — коэффициент надежности теста; SE — стандартная ошибка измерения.
Обычно выражение (5.79) используется для вычисления SE по известным величинам rн и Sx. Что касается сущностного смысла, то SE (standard error of measurement) трактуется как стандартное отклонение результатов испытуемого от его истинного балла, полученное при выполнении им большого числа параллельных форм теста.
Для лучшего уяснения смысла показателя SE можно представить другую гипотетическую ситуацию, когда i-и испытуемый выполнял много раз один и тот же тест. Если предположить, что эффект запоминания отсутствует, то результаты тестирования образуют нормальное распределение вокруг истинного балла Т{ со стандартным отклонением se.
На практике рассматривается как статистическая величина, отражающая степень точности отдельных измерений, поэтому величину SE используют для определения границ доверительного интервала, внутри которого должен находиться истинный балл оцениваемого ученика группы.
Общераспространен подход, когда доверительный интервал выстраивается как две симметричные окрестности (левая и правая) вокруг наблюдаемого показателя ученика, хотя это не совсем верно, поскольку речь должна идти об окрестностях, расположенных слева и справа от истинного балла. Тем не менее этот факт обычно игнорируется в прикладных исследованиях, и доверительный интервал при заданном риске допустить ошибку а = 0,05, т.е. в пяти случаях из ста, принимается равным
где Xi — наблюдаемый балл i-го испытуемого; 1,96 — константа, табличное число, используемое при t= 0,05.
Для рассматриваемого ранее примера матрицы тестовых результатов (см. табл. 5.3), коэффициента надежности rн= 0,78 и стандартного отклонения Sx= 2,62 (см. разд. 5.2) SEпо формуле (5.79) получится
Тогда доверительный интервал для истинного балла первого ученика со значением Х1 = 6 будет (6 - 1,96 • 1,23; 6 + 1,96 • 1,23).
Интересна геометрическая интерпретация доверительного интервала на оси наблюдаемых баллов учеников (рис. 5.39).
Следовательно, истинный балл первого ученика может находиться в любой точке этого интервала. Таким образом, стандартная ошибка измерения является стандартной погрешностью оценки истинных баллов на основании наблюдаемых результатов тестовых измерений.
Очевидно, что с ростом SE границы доверительного интервала будут раздвигаться, и вместе с тем будут увеличиваться возможные пределы отклонения истинного балла от наблюдаемых результатов' измерения (более правильная с точки зрения теории трактовка: пределы отклонения наблюдаемых баллов от истинной компоненты измерения).
Хотелось бы думать, что после изложения материала раздела преподаватели, использующие в своей работе готовые тесты, будут с большим пониманием относиться к стремлениям разработчиков снизить ошибку измерения с помощью повышения надежности теста. Эти стремления не являются лишь изобретениями теоретиков, а вытекают логически из предположений о погрешностях измерения. Для завершения вопроса о погрешностях необходимо перейти к следующей теме, более простой, но, несмотря на это, очень полезной в сфере интерпретации результатов тестовых измерений.
предсказание истинных баллов