Психометрическая проверка теста анализ пунктов теста
В качестве исходного материала для разработки ТУСа мы использовали чешский вариант ТСИ.
После перевода обеих форм теста на русский язык была проведена лингвистическая и социальная адаптация невербальных заданий и создана 1-ая предварительная форма теста для первичной психометрической проверки. Затем обе Формы ТСИ были проведены без ограничения времени на выборке в 300 человек в возрасте от 16-ти до 25-ти лет. На основе полученных данных для каждого задания теста подсчитывались индекс трудности и коэффициент корреляции с итоговым баллом. По окончании этого этапа были скорректированы или заменены около 20 заданий вербальных субтестов. Невербальные субтесты были оставлены без изменений. С учетом внесенных изменений была скомпонована 2-ая предварительная форма теста, включающая два варианта (А и В) , которая была вновь подвергнута статистическому анализу. Статистический анализ проводился для Формы А на выборке в 115 человек, а для формы В - на выборке в 110 человек. Данная выборка состояла из примерно одинакового количества мужчин и женщин. Возрастной диапазон выборки - от 14-ти до 35-ти лет. Сюда вошли учащиеся средних школ г. Ярославля, молодые рабочие, студенты высших и средних специальных учебных заведений, а также лица, имеющие высшее образование.
На данном этапе тест проводился без ограничения времени, и каждый субтест выполнялся всеми испытуемыми до конца. По результатам этого этапа для каждого задания обеих форм методики вновь подсчитывались следующие показатели:
- индекс трудности;
- коэффициент корреляции с итоговым баллом по субтесту;
- характер распределения ответов.
При отборе утверждений для составления окончательной формы методики мы исходили из того, что индекс трудности для каждого утверждения должен находиться в пределах от 0.16 до 0.84, коэффициент корреляции с итоговым баллом должен быть не ниже 0.20, а характер распределения ответов должен приближаться к нормальному [1,3,4,8].
В результате такого анализа из двух форм методики была составлена одна Форма, все задания которой соответствовали вышеперечисленным требованиям. После этого был скорректирован порядок заданий в каждом субтесте в соответствии с полученным индексом трудности.
В целях проверки индекса трудности заданий в новом порядке их предъявления, а также с тем, чтобы рассчитать временные ограничения в предъявлении субтестов, окончательная форма методики была вновь апробирована на выборке в 120 человек, состоящей из примерно одинакового количества мужчин и женщин. Возрастной диапазон - от 14 до 35 лет. В данном случае все субтесты методики также проводились без ограничения времени.
Кроме того, по окончании этого этапа проверки высчитывались временные ограничения в предъявлении субтестов.
В нашем варианте методики были получены следующие временные интервалы для решения отдельных субтестов:
Субтест 1-7 минут.
Субтест 2-6 минут.
Субтест 3-7 минут.
Субтест 4-10 минут.
Субтест 5-15 минут.
Субтест 6-15 минут.
Субтест 7-7 минут.
Субтест 8-8 минут.
Субтест 9 заучивание - 3 минуты, воспроизведение - б минут.
ПРОВЕРКА НА НАДЕЖНОСТЬ
Проверка надежности по однородности ТУС проводилась отдельно для каждого субтеста по следующим коэффициентам, по Формуле Кюдера-Ричардсона (для субтеста 4 по Формуле Кронбаха) и по Формуле Спирмена-Брауна (по полной форме).
Проверка проводилась на выборке в 179 человек, в возрасте от 15 до 35 лет, состоящей из приблизительно 60% мужчин и 50% женщин В данную выборку вошли лица со средний, средним специальным, средним техническим и высшим образованием, а также учащиеся общеобразовательных школ города Ярославля. Результаты проверки на надежность представлены в таблице 1.
Таблица 1. Надежность по однородности отдельных субтестов ТУС.
Данные по ре-тестовой надежности, приводимые чешскими авторами говорят о достаточно высокой устойчивости тестовых оценок. В результате повторного тестирования учащихся средней экономической школы с интервалом в 3 года ими был получен коэффициент корреляции равный 748. По нашим данным этот коэффициент надежности при интервале J недели оказался равным .419.
ПРОВЕРКА НА ВАЛИДНОСТЬ
На этапе проверки конструктной валидности тус высчитывались коэффициенты корреляции отдельных субтестов с окончательным результатом по всей методике. Эти данные приведены в таблице 2. Для сравнения в данной таблице приведены также коэффициенты, полученные чешскими авторами, а также данные, полученные Амтхауэром.
[Таблица 2. Корреляции субтестов с итоговым баллом по тесту.]
Кроме того, проверка данного вида валидности ТУС проводилась путем вычисления корреляции итоговых баллов по отдельным субтестам с итоговым баллом теста "Домино". Тест "Домино" - это известная методика предназначенная для измерения невербального интеллекта. Основная задача испытуемого - вскрыть определенную закономерность, в соответствии с которой на карточках выстроены фишки домино, и заполнить пустую фишку. Выборка, на которой проводился данный вид проверки, состояла из 103 человек в возрасте от 17-ти до 35-ти лет. включающей примерно одинаковое количество мужчин и женщин.
Коэффициенты корреляции отдельных субтеста ТУС и итогового балла по всему тесту с тестом "Домино" представлены в таблице 3.
[Таблица 3. Коэффициенты корреляции отдельных субтестов ТУС и итогового балла по всему тесту с показателем теста "Домино".]
Примечание: Все коэффициенты корреляции, представленные в таблице 3, значимы на уровне 1%.
Чешские авторы приводят следующие данные по корреляции итогового балла теста с другими методиками: шкала В опросника Кэттела (r = 0.614), матрицы Равена (r = 0.353)
Оценка критериальной валидности проводилась 2- мя способами: методом контрастных групп (проверка значимости различий показате
лей отдельных субтестов методики и его окончательного результата мужской и женской выборки по t-критерию Стьюдента), а также путем вычисления корреляции итогового балла теста с показателем школьной успеваемости.
Проверка методом контрастных групп базировалась на выборке в 254 человека. Мужская выборка состояла из 119 испытуемых, женская выборка состояла из 135 испытуемых. Возрастной диапазон выборки -16-35 лет. Статистически значимыми оказались различия по арифметическому субтесту и по субтесту определения закономерностей (у мужчин выше) . По чешским данным статистически показательными являются субтест на запоминание (у женщин выше), арифметический субтест (у мужчин выше) и субтест "геометрическое сложение" (у мужчин выше).
Проверка методом вычисления корреляции итогового балла теста с показателем школьной успеваемости (средняя оценка) проводилась на выборке в 35 человек - учащихся 11 класса общеобразовательных школ города Ярославля (r = 0.51) . По чешским данным коэффициент корреляции общего результата теста с показателем школьной успеваемости на аналогичной выборке равен 0.45.
Таким образом, достаточно высокие показатели критериальной и конструктной валидности ТУС, а также их сходство с аналогичными показателями чешского варианта теста и данными Р.Амтхауэра говорят о том, что предлагаемая модификация методики позволяет делать достаточно обоснованные выводы об уровне интеллекта и его структуре, а также сохраняет все предложенные Р.Амтхауэром закономерности в измерении умственной деятельности человека.
СТАНДАРТИЗАЦИЯ ТЕСТА
Чешская стандартизация теста Амтхауэра показала, что в возрастном диапазоне от 16-ти до 35-ти лет значительных различий в успешности выполнения теста не наблюдается. Опираясь на эти данные, мы произвели разработку ориентировочных норм ТУС для выборки в возрасте от 16-ти и старше. Наша выборка стандартизации составила 560 испытуемых, куда вошли учащиеся средних школ. студенты высших и средних специальных учебных заведений, а также лица, имеющие высшее образование. Кроме того, были разработаны нормы для возрастного диапазона от 14 до 15 лет отдельно для мужской и женской выборки. Данная выборка включала в себя 186 юношей и 210 девушек, учащихся средних школ г. Ярославля.
В качестве стандартной шкалы использовалась шкала IQ (среднее значение - 100, 5 = 10). Проверка распределения на нормальность проводилась по критерию А отдельно для каждого субтеста и итогового балла по всему тесту. Проведенная стандартизация показала, что характер распределения первичных оценок как по отдельным субтестам, так и по всему тесту в целом не отличается от нормального, поэтому на основе линейного преобразования были построены таблицы перевода первичных оценок в стандартные баллы (см. приложение)