Надежность-согласованность (синхронная, одномоментная надежность)
НАДЕЖНОСТЬ ТЕСТА
Надежность и точность
Надежность теста – характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию случайных посторонних факторов. Результат психологического исследования обычно подвержен действию большого количества неучтенных факторов. К ним относятся:
- эмоциональное состояние,
- утомление,
- уровень мотивации испытуемых.
- а также время проведения обследования, температура воздуха, освещенность и т.п. внешние факторы.
При обследовании с помощью теста группы испытуемых получаются разные результаты у отдельных испытуемых. Разброс результатов тестового обследования оценивается с помощью дисперсии. Эта дисперсия является результатом влияния двух причин:
1) изменчивости, присущей измеряемому свойству, т.е. это свойство выражено у разных испытуемых по-разному,
2) влияния случайных факторов, обуславливающих нестабильность измерительной процедуры.
Отсюда дисперсия результатов обследования находится так:
,
где Sx2 – эмпирическая дисперсия теста,
St2 – истинная дисперсия или дисперсия измеряемого свойства,
Se2 – дисперсия ошибки.
Надежность теста может быть оценена как отношение истинной дисперсии к эмпирической дисперсии:
,
,
,
– формула Рюлона.
Надежность целого теста
Различают два вида надежности теста:
1. Надежность-устойчивость (ретестовая, диахронная). Она характеризует устойчивость теста по отношению к факторам, изменяющимся во времени, иначе, стабильность результатов обследования во времени, применяется для оценки надежности тестов, предназначенных для измерения стабильных, устойчивых психологических качеств таких, например, как темперамент, ригидность, интеллект и т.п.
Она измеряется с помощью повторного тестирования той же самой выборки испытуемых, что и в первый раз. Обычно второе тестирование проводится через две недели после первого. В качестве показателя надежности используется коэффициент корреляции, который показывает тесноту связи между результатами первого и второго тестирования. Для интервальных шкал подсчитывается коэффициент линейной корреляции Пирсона. Для шкал порядка в качестве меры надежности используется коэффициент ранговой корреляции Спирмена. Чем выше полученный коэффициент корреляции, тем выше надежность теста. Обычно этот коэффициент корреляции составляет 0,7 – 0,8.
Зная данную величину корреляции, можно вычислить истинное значение тестового балла конкретного испытуемого:
Где Хti – истинный балл i-го испытуемого
Хi – эмпирический балл i-го испытуемого
r – эмпирически измеренная надежность теста
– среднее арифметическое по тесту.
.
Надежность-согласованность (синхронная, одномоментная надежность).
Она характеризует в какой мере согласованно дифференцируют испытуемых отдельные части теста. Она показывает устойчивость отдельных частей теста к воздействующим в данный момент случайным факторам.
Простейший способ оценки надежности-согласованности предполагает расщепление целого теста на 2 части, например, к первой части относятся четные пункты, ко второй – нечетные. По каждой половине рассчитываются суммарные баллы и между двумя рядами баллов по испытуемым рассчитывают коэффициент корреляции. Получается коэффициент, относящийся к половинам теста. Если суммарные баллы по двум половинам теста нормализованы, то рекомендуется использовать ранговую корреляцию. Для того чтобы найти надежность целого теста (r), пользуются формулой Спирмена – Брауна:
rxx – надежность целого теста,
rx – эмпирически рассчитанный коэффициент корреляции между двумя половинами теста.
Деление теста на две части может быть осуществлено разными способами, и каждый раз будут получаться несколько разные коэффициенты. Поэтому предлагается делить тест на столько частей, сколько в нем пунктов. Тогда надежность вычисляется по формуле Кронбаха:
α – коэффициент Кронбаха,
К – количество пунктов теста,
Sj2 – дисперсия по j-му пункту теста,
Sх2 – дисперсия суммарных баллов по всему тесту.
Данная формула используется, когда пункты теста предполагают ответы с использованием трех и более шаговых шкал.
Если ответы даются в дихотомической шкале, то используется формула Кьюдера – Ричардсона:
KR20 – коэффициент Кьюдера – Ричардсона – показатель надежности;
– дисперсия j-го пункта теста;
Pj – относительная доля правильных ответов (ответов «да») на j-й пункт теста:
n – количество испытуемых,
– количество ответов верно («да») на j-й пункт теста;
– относительная доля ответов неверно («нет») на j-й пункт теста.