Устойчивость распределения
Проверка устойчивости распределения. Общая логика проверки устойчивости распределения основывается на следующем индуктивном рассуждении: если полученное по половине выборки распределение хорошо моделирует конфигурацию целого распределения, то можно предположить, что это целое распределение будет также хорошо моделировать распределение генеральной совокупности [15].
Таким образом, доказательство устойчивости распределения означает доказательство репрезентативности тестовых норм. Традиционный способ доказательства устойчивости сводится к выяснению хорошего приближения эмпирического распределения к какому-либо теоретическому. Но если эмпирическое распределение не приближается к теоретическому, несмотря на значительное увеличение численности выборки, то приходится прибегать к более общему методу доказательства.
Его простейший вариант может быть сведен к следующим шагам:
- построить таблицу перевода "сырых" очков в нормализованную шкалу по данным всей выборки;
- затем, применить эту таблицу для каждого испытуемого из половины выборки (при этом под "половиной" выборки подразумевается случайная половина, в которую испытуемые зачисляются случайным образом);
- построить распределение нормализованных баллов для половины выборки;
- проверить приближается ли это распределение к нормальному (близость к нормальному распределению проверяется с помощью критерия Колмогорова, при n‹200 целесообразно использовать более мощные критерии "хи-квадрат" или другие);
- сделать вывод: если распределение нормализованных баллов из половины выборки хорошо приближается к нормальному, то это значит, что заданные таблицами нормализации тестовые нормы определены устойчиво.
В общем случае такой простейший метод установлении однородности двух эмпирических распределений может быть применен и при разбиении выборки по какому-либо систематическому признаку. Если, в частности, по какому-либо из популяционно-значимых признаков (пол, возраст, образование, профессия) психолог получает значимую неоднородность эмпирических распределений, то это значит, что относительно данных популяционных категорий тестовые нормы должны быть специализированы (одна таблица норм - для мужчин, другая - для женщин и т. д.).
Более корректный метод статистической проверки однородности двух распределений, полученных при расщеплении выборки на равные части, опять же связан с применением критерия Колмогорова. Для этого с табличным значением сравнивается величина:
,
где - кумулятивная относительная частота для i-того интервала шкалы по первой половине выборки;
- та же частота для второй половины;
n - численность полной выборки;
- эмпирическое значение статистики Колмогорова.
Точные значения квантилей распределения Колмогорова для определения размеров выборки можно найти в справочниках по статистике. Применение критерия Колмогорова не зависит от нормальности целого распределения.
Итак, априорная предпосылка нормальности распределения тестовых баллов основывается скорее на принципах операционального удобства, чем на теоретической необходимости. Психометрически корректные процедуры получения устойчивых тестовых норм возможны также с помощью специальных методов непараметрической статистики (критерий "хи-квадрат и т. п.) для распределений произвольной формы.
Выбор статистической модели распределения - полностью зависит от психометриста до тех пор, пока сам тест выступает в качестве единственного эталона измеряемого свойства. В этом случае остается лишь тщательно следить за соответствием сферы применения диагностических норм той выборке испытуемых, на которых они были получены. Произвольность в выборе статистической модели шкалы исчезает, когда речь заходит о внешних по отношению к тесту критериях [1, 15]. Рассмотрим, в связи с этим, репрезентативность критериальных тестов.