Репрезентативность тестовых норм

Зачем нужны тестовые нормы? Любые тестовые заключения при

использовании статистических тестовых норм являются относительными.

Они зависят от той выборки, на которой производилась стандартизация

теста. То, насколько выборка стандартизации позволяет применить тест на

широкой популяции, называется репрезентативностью тестовых норм.

(Популяция – категория испытуемых определенной социальной, профес-

сиональной или половозрастной принадлежности.) Норма теста – средний

диапазон значений на шкале измеряемого свойства характерный для испы-

туемых определенной группы. Их меняют каждые 5 лет.

Репрезентативность (от фр. – показательный) тестовых норм – свойст-

во выборочной совокупности представлять генеральную совокупность.

Репрезентативность означает, что с некоторой наперед заданной или

определенной статистической погрешностью можно считать, что пред-

ставление в выборочной совокупности распределение изучаемых призна-

ков соответствует их реальному распределению. Ошибка репрезентативно-

сти – различие характеристик выборки и генеральной совокупности.

Выборка, на которой определяется статистические тестовые нормы,

называется выборкой стандартизации. Ее численность, как правило, не

меньше 200 человек.

В репрезентативности тестовых норм рассматривают следующие

проблемы:

1. Стандартизация шкалы.

2. Статистическая природа тестовых шкал. Как повысить долю посто-

янного компонента и сократить долю случайного в величине суммарного

балла по шкале теста.

3. Проблема меры в психометрике. В дифференциальной психометрике

отсутствуют физические эталоны: мы не располагаем индивидами, которые

были бы постоянными носителями заданной величины измеряемого свой-

ства. Роль косвенных эталонов в психометрике выполняют сами тесты.

4. Оценка типа распределения тестовых баллов и проверка устойчиво-

сти распределения. Используют следующие параметры: среднее арифме-

тическое, среднее квадратическое (стандартное) отклонение, асимметрия,

эксцесс, общее неравенство Чебышева, критерий Колмогорова. Общая ло-

гика проверки устойчивости распределения основывается на индуктивном

рассуждении: если «половинное» (полученное на половине выборки) рас-

пределение хорошо моделирует конфигурацию целого распределения, то

можно предположить, что это целое распределение будет хорошо модели-

ровать распределение генеральной совокупности.

Доказательство устойчивости распределения означает доказательство

репрезентативности норм. Традиционный способ доказательства устойчи-

вости сводится к выяснению хорошего приближения эмпирического рас-

пределения к какому-либо теоретическому (например, нормальному рас-

пределению, хотя может быть и любое другое).

5. Тестовые эталоны (или тестовые нормы).

5.1. Сама сырая шкала может иметь практический смысл.

5.2. Стандартизированные шкалы: Шкала IQ, Т-шкала, шкала стэнай-

нов (стандартная девятка), шкала стэнов.

5.З. Процентильная шкала. Процентиль – процент испытуемых из вы-

борки стандартизации, которые получили равный или более низкий балл,

чем балл данного испытуемого. Процентили указывают на относительное

положение индивида в выборке стандартизации. Их можно рассматривать

как ранговые градации, общее число которых равно ста, только (в отличие

от ранжирования) отсчет ведется снизу. Поэтому чем ниже процентиль,

тем хуже позиция индивида. Процентили отличаются от процентных пока-

зателей. Процентные показатели фиксируют качество выполненных зада-

ний. Процентиль – это производный показатель, указывающий на долю от

общего числа членов группы.

5.4. Критериальные нормы. В качестве эталона используется целевой

критерий. Высокую эффективность показывают узкоспециализированные

диагностические методики, нацеленные на очень конкретные и узкие кри-

терии. Хорошо зарекомендовали в сфере образования (тесты достижений и

КОРТ).

5.5. Социально-психологический норматив.

Независим от результатов испытаний и объективно задан. СПН реали-

зуется в совокупности заданий, составляющих тест. Следовательно, сам

тест в полном его объеме и является таким нормативом. Для анализа дан-

ных относительно их близости к СПН, рассматривается как 100% -ое вы-

полнение теста, испытуемые делятся на 5 подгрупп. Для каждой из под-

групп подсчитывается средний процент правильно выполнивших задания.

10% – наиболее успешные, 20% – близкие к успешным, 40% – средние,

20% – мало успешные, 10% – наименее успешные.

Стандартизация – это единообразие процедуры проведения и

оценки выполнения теста. Стандартизация как выработка единых требова-

ний к процедуре эксперимента и как определение единого критерия оценки

результатов диагностических испытаний.

Стандартизация процедуры эксперимента подразумевает регла-

ментацию процедуры, унификацию инструкций, бланков обследования,

способов регистрации результатов, условий проведения обследования, ха-

рактеристика контингентов испытуемых (указывается область применения

теста). К числу требований, которые необходимо соблюдать при проведе-

нии эксперимента относятся такие: инструкции следует сообщать испы-

туемым одинаковым образом, как правило, письменно; в случае устных

указаний они даются в разных группах одними и теми же словами, понят-

ными для всех, в одинаковой манере; ни одному испытуемому не следует

давать никаких преимуществ перед другими; в процессе эксперимента не

давать отдельным испытуемым дополнительные пояснения; эксперимент с

разными группами следует проводить в одинаковое, по возможности, вре-

мя дня, в сходных условиях; временные ограничения в выполнении зада-

ний для всех испытуемых должны быть одинаковыми.

Обычно авторы методики в руководстве приводят точные и подроб-

ные указания по процедуре ее проведения. Формулирование таких указа-

ний составляет основную часть стандартизации новой методики, т.к. толь-

ко строгое и соблюдение дает возможность сравнить между собой показа-

тели, полученные разными испытуемыми.

Во втором случае под стандартизацией понимается преобразо-

вание нормальной (или искусственно нормализованной) шкалы оценок в

новую шкалу, основанную уже не на количественных эмпирических зна-

чениях изучаемого показателя, а на оценке его относительного места в

распределении результатов в выборке испытуемых.

Первоначальный суммарный балл, подсчитанный с помощью ключа,

не является показателем, который можно диагностически интерпретиро-

вать. Его называют «сырым тестовым баллом». Для применения тестовых

норм необходимо перевести тестовые баллы из «сырой» шкалы в «стан-

дартную». Эта процедура называется «стандартизация тестового балла».

При простейшей линейной стандартизации сначала высчитывается –

Z-показатель (стандартный балл по стандартной шкале Z).

X–X

Z = ------------ ;

Sx

где Z (с центром 0 и отклонением 1), Х – сырой балл по тесту, X – средний

балл по выборке стандартизации, Sx (о) – стандартное отклонение по вы-

борке стандартизации.

После получения стандартного балла Z можно перевести тестовый балл

в любую стандартную тестовую шкалу, принятую в психодиагностике.

Например, перевод в шкалу IQ, производится по формуле:

X−X

IQ = 100 + 15 ⋅

σ

В шкале IQ центр равен 100, а отклонение равно 15.

Если перевод требуемся в шкалу «стенов» (от англ. «standart ten» –

стандартная десятка), то формула пересчета из шкалы Z выглядит так:

X−X

S = 5,5 +

σ

В шкале стенов центр равен 5.5, а отклонение равно 2.

Т-шкала Маккола (MMPI) (центр равен 50, отклонение равно 10):

X−X

T = 50 + 10 ⋅

σ

Для серьезных профессиональных тестов вместо простейшей линей-

ной стандартизации используется более сложная процедура нелинейной

нормализации (форсированный переход к нормальному распределению).

В результате этой, более точной процедуры разработчики снабжают

пользователей теста конверсионной таблицей для перевода сырых баллов в

стандартные баллы по заданной шкале. В ней приводится полный перечень

соответствий между интервалами сырой шкалы и интервалами стандартной.

Таким образом, благодаря стандартизации методики достигается со-

поставимость полученных результатов у разных испытуемых, появляется

возможность выражения тестовых оценок в относительных к выборке

стандартизации показателях, сопоставления таких оценок в разных тесто-

вых методиках.

Наши рекомендации