Психометрическая проверка теста анализ пунктов теста

В качестве исходного материала для разработки ТУСа мы использовали чешский вариант ТСИ.

После перевода обеих форм теста на русский язык была проведена лингвистическая и социальная адаптация невербальных заданий и создана 1-ая предварительная форма теста для первичной психометрической проверки. Затем обе Формы ТСИ были проведены без ограничения времени на выборке в 300 человек в возрасте от 16-ти до 25-ти лет. На основе полученных данных для каждого задания теста подсчитывались индекс трудности и коэффициент корреляции с итоговым баллом. По окончании этого этапа были скорректированы или заменены около 20 заданий вербальных субтестов. Невербальные субтесты были оставлены без изменений. С учетом внесенных изменений была скомпонована 2-ая предварительная форма теста, включающая два варианта (А и В) , которая была вновь подвергнута статистическому анализу. Статистический анализ проводился для Формы А на выборке в 115 человек, а для формы В - на выборке в 110 человек. Данная выборка состояла из примерно одинакового количества мужчин и женщин. Возрастной диапазон выборки - от 14-ти до 35-ти лет. Сюда вошли учащиеся средних школ г. Ярославля, молодые рабочие, студенты высших и средних специальных учебных заведений, а также лица, имеющие высшее образование.

На данном этапе тест проводился без ограничения времени, и каждый субтест выполнялся всеми испытуемыми до конца. По результатам этого этапа для каждого задания обеих форм методики вновь подсчитывались следующие показатели:

- индекс трудности;

- коэффициент корреляции с итоговым баллом по субтесту;

- характер распределения ответов.

При отборе утверждений для составления окончательной формы методики мы исходили из того, что индекс трудности для каждого утверждения должен находиться в пределах от 0.16 до 0.84, коэффициент корреляции с итоговым баллом должен быть не ниже 0.20, а характер распределения ответов должен приближаться к нормальному [1,3,4,8].

В результате такого анализа из двух форм методики была составлена одна Форма, все задания которой соответствовали вышеперечисленным требованиям. После этого был скорректирован порядок заданий в каждом субтесте в соответствии с полученным индексом трудности.

В целях проверки индекса трудности заданий в новом порядке их предъявления, а также с тем, чтобы рассчитать временные ограничения в предъявлении субтестов, окончательная форма методики была вновь апробирована на выборке в 120 человек, состоящей из примерно одинакового количества мужчин и женщин. Возрастной диапазон - от 14 до 35 лет. В данном случае все субтесты методики также проводились без ограничения времени.

Кроме того, по окончании этого этапа проверки высчитывались временные ограничения в предъявлении субтестов.

В нашем варианте методики были получены следующие временные интервалы для решения отдельных субтестов:

Субтест 1-7 минут.

Субтест 2-6 минут.

Субтест 3-7 минут.

Субтест 4-10 минут.

Субтест 5-15 минут.

Субтест 6-15 минут.

Субтест 7-7 минут.

Субтест 8-8 минут.

Субтест 9 заучивание - 3 минуты, воспроизведение - б минут.

ПРОВЕРКА НА НАДЕЖНОСТЬ

Проверка надежности по однородности ТУС проводилась отдельно для каждого субтеста по следующим коэффициентам, по Формуле Кюдера-Ричардсона (для субтеста 4 по Формуле Кронбаха) и по Формуле Спирмена-Брауна (по полной форме).

Проверка проводилась на выборке в 179 человек, в возрасте от 15 до 35 лет, состоящей из приблизительно 60% мужчин и 50% женщин В данную выборку вошли лица со средний, средним специальным, средним техническим и высшим образованием, а также учащиеся общеобразовательных школ города Ярославля. Результаты проверки на надежность представлены в таблице 1.

Таблица 1. Надежность по однородности отдельных субтестов ТУС.

Данные по ре-тестовой надежности, приводимые чешскими авторами говорят о достаточно высокой устойчивости тестовых оценок. В результате повторного тестирования учащихся средней экономической школы с интервалом в 3 года ими был получен коэффициент корреляции равный 748. По нашим данным этот коэффициент надежности при интервале J недели оказался равным .419.

ПРОВЕРКА НА ВАЛИДНОСТЬ

На этапе проверки конструктной валидности тус высчитывались коэффициенты корреляции отдельных субтестов с окончательным результатом по всей методике. Эти данные приведены в таблице 2. Для сравнения в данной таблице приведены также коэффициенты, полученные чешскими авторами, а также данные, полученные Амтхауэром.

[Таблица 2. Корреляции субтестов с итоговым баллом по тесту.]

Кроме того, проверка данного вида валидности ТУС проводилась путем вычисления корреляции итоговых баллов по отдельным субтестам с итоговым баллом теста "Домино". Тест "Домино" - это известная методика предназначенная для измерения невербального интеллекта. Основная задача испытуемого - вскрыть определенную закономерность, в соответствии с которой на карточках выстроены фишки домино, и заполнить пустую фишку. Выборка, на которой проводился данный вид проверки, состояла из 103 человек в возрасте от 17-ти до 35-ти лет. включающей примерно одинаковое количество мужчин и женщин.

Коэффициенты корреляции отдельных субтеста ТУС и итогового балла по всему тесту с тестом "Домино" представлены в таблице 3.

[Таблица 3. Коэффициенты корреляции отдельных субтестов ТУС и итогового балла по всему тесту с показателем теста "Домино".]

Примечание: Все коэффициенты корреляции, представленные в таблице 3, значимы на уровне 1%.

Чешские авторы приводят следующие данные по корреляции итогового балла теста с другими методиками: шкала В опросника Кэттела (r = 0.614), матрицы Равена (r = 0.353)

Оценка критериальной валидности проводилась 2- мя способами: методом контрастных групп (проверка значимости различий показате

лей отдельных субтестов методики и его окончательного результата мужской и женской выборки по t-критерию Стьюдента), а также путем вычисления корреляции итогового балла теста с показателем школьной успеваемости.

Проверка методом контрастных групп базировалась на выборке в 254 человека. Мужская выборка состояла из 119 испытуемых, женская выборка состояла из 135 испытуемых. Возрастной диапазон выборки -16-35 лет. Статистически значимыми оказались различия по арифметическому субтесту и по субтесту определения закономерностей (у мужчин выше) . По чешским данным статистически показательными являются субтест на запоминание (у женщин выше), арифметический субтест (у мужчин выше) и субтест "геометрическое сложение" (у мужчин выше).

Проверка методом вычисления корреляции итогового балла теста с показателем школьной успеваемости (средняя оценка) проводилась на выборке в 35 человек - учащихся 11 класса общеобразовательных школ города Ярославля (r = 0.51) . По чешским данным коэффициент корреляции общего результата теста с показателем школьной успеваемости на аналогичной выборке равен 0.45.

Таким образом, достаточно высокие показатели критериальной и конструктной валидности ТУС, а также их сходство с аналогичными показателями чешского варианта теста и данными Р.Амтхауэра говорят о том, что предлагаемая модификация методики позволяет делать достаточно обоснованные выводы об уровне интеллекта и его структуре, а также сохраняет все предложенные Р.Амтхауэром закономерности в измерении умственной деятельности человека.

СТАНДАРТИЗАЦИЯ ТЕСТА

Чешская стандартизация теста Амтхауэра показала, что в возрастном диапазоне от 16-ти до 35-ти лет значительных различий в успешности выполнения теста не наблюдается. Опираясь на эти данные, мы произвели разработку ориентировочных норм ТУС для выборки в возрасте от 16-ти и старше. Наша выборка стандартизации составила 560 испытуемых, куда вошли учащиеся средних школ. студенты высших и средних специальных учебных заведений, а также лица, имеющие высшее образование. Кроме того, были разработаны нормы для возрастного диапазона от 14 до 15 лет отдельно для мужской и женской выборки. Данная выборка включала в себя 186 юношей и 210 девушек, учащихся средних школ г. Ярославля.

В качестве стандартной шкалы использовалась шкала IQ (среднее значение - 100, 5 = 10). Проверка распределения на нормальность проводилась по критерию А отдельно для каждого субтеста и итогового балла по всему тесту. Проведенная стандартизация показала, что характер распределения первичных оценок как по отдельным субтестам, так и по всему тесту в целом не отличается от нормального, поэтому на основе линейного преобразования были построены таблицы перевода первичных оценок в стандартные баллы (см. приложение)

Наши рекомендации

Образец теста промежуточной аттестации (экзаменационного теста)

Процессы, происходящие при замешивании теста и выпекании изделий из дрожжевого теста

Приготовление и рецептура блинного теста и теста для оладий

Психометрическая проверка теста

Информативность пунктов и теста

Результаты теста Тулуз-Пьерона и теста Бендер при подгрупповом обследовании дошкольников 6 и 7 лет

Надежность отдельных пунктов теста

Одномоментная надежность отдельных пунктов теста

Микрофлора ржаных заквасок и теста. Значение фактора кислотности для ржаного теста. Правила ТБ при работе хлебохранилища и экспедиции

Основные характеристики пригодности теста. валидность и надёжность теста

← Предыдущая страница | Следующая страница →