Надежность частей теста. Уравнение Спирмена-Брауна. Определение коэффициента надежности с помощью формул Фланагана и Рюлона
Надежность частей теста – характеристика надежности психодиагностической методики, получаемая путем анализа устойчивости результатов отдельных совокупностей тестовых задач или единичных пунктов (заданий) теста. Наиболее простым и распространенным способом определения надежности частей теста является метод расщепления,суть которого заключается в выполнении испытуемым заданий двух равноценных частей теста.
Разделение объема заданий теста на сопоставимые части достигается:
а) распределением заданий на четные и нечетные (в том случае, если задания в тесте строго ранжированы по степени субъективной трудности);
б) распределением пунктов по принципу близости или равенства значений индексов трудности. Такой принцип разделения пригоден для тестов достижений, в которых обязателен ответ испытуемых на все пункты;
в) распределением задач по времени решения каждой из частей (для тестов скорости).
Для испытуемых в выборке определения надежности вычисляются оценки успешности решений, среднеквад-ратические отклонения первого и второго рядов оценок и коэффициенты корреляции сравниваемых рядов.
Уравнение Спирмена-Брауна отражает влияние изменения количества заданий на коэффициент надежности теста:
rt = nr't / 1 + (n – 1) r't,
где rt – коэффициент надежности для полного объема заданий;
r't – его значение после изменения числа заданий;
n – отношение нового числа заданий к первоначальному (если число заданий полного теста – 100, а его части, полученной методом расщепления на половины, – 50, то n = 0,5). Отсюда для полного теста:
rt = 2r't / 1 + r't.
Приведенные формулы справедливы для случаев равных стандартных отклонений обеих половин теста (σxl = σх2). Если (σxl отличается от (σх2, для определения коэффициента надежности применяется формула Фланагана:
rt = 4σxlσх2r't / σxl+ σх2+ 2σxlσх2r't.
При определении rt целого теста можно воспользоваться формулой Рюлона:
rt = 1 −σ2Δ/ σ2x,
где σ2Δ – дисперсия разностей между результатами каждого испытуемого по двум половинам теста;
σ2x – дисперсия суммарных результатов. В данном случае коэффициент надежности рассчитывается как доля «истинной» дисперсии результатов теста.
Характеристика надежности по типу надежности частей теста имеет серьезные преимущества по сравнению с надежностью ретестовой и надежностью параллельных форм главным образом благодаря отсутствию необходимости в повторном обследовании.
Определения валидности. Важнейшие составляющие валидности
Валидность(англ. valid – «действительный, пригодный, имеющий силу») – комплексная характеристика методики (теста), включающая сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним.
В психодиагностике валидность – обязательная и наиболее важная часть сведений о методике, включающая данные о степени согласованности результатов теста с другими сведениями об исследуемой личности, полученными из различных источников (теоретические ожидания, наблюдение, экспертные оценки, результаты других методик, достоверность которых установлена и т. д.), связь изучаемой области поведения или особенности личности с определенными психологическими конструктами.
Важнейшая составляющая валидности – определение области изучаемых свойств – имеет принципиальное теоретическое и практическое значение при выборе методики исследования и интерпретации ее данных.
В большей степени достоверность данных теста определяется набором измеряемых свойств.Различные категории этих сведений и способы их получения образуют типы валидности.
Диагностическая (конкурентная) валидностьотражает способность теста дифференцировать испытуемых по изучаемому признаку. Сведения, характеризующие степени обоснованности и статистической надежности развития исследуемой психологической особенности в будущем, составляют прогностическую валидностьметодики.
Два этих типа валидности нередко объединяют в понятие эмпирической валидности.Здесь подчеркивается общность подхода к их определению, который осуществляется путем статистического коррелирования баллов (оценок) по тесту и показателей по внешнему параметру, избранному в качестве валидизации критерия (см. валидности критериальная). Критерий валидности выступает в качестве меры, показателя исследуемых психологических особенностей.
Подтверждение гипотез свидетельствует о теоретической обоснованности методики, т. е. о степени ее конструктной валидности.Этот тип валидности является наиболее сложным и комплексным.
Валидность содержательная (внутренняя, логическая) – комплекс сведений о репрезентативности заданий теста по отношению к измеряемым свойствам и особенностям.
Наряду с перечисленными основными типами валид-ности (содержательной, критериальной и конструктной) на практике выделяют факторную, перекрестную (конвергентную)и дискриминантнуювалидности.