Эквивалентность теста

Нередко тест выбирают из определенного числа однотипных тестов. Например, броски в баскетбольную корзину можно выполнять с разных точек; спринтерский бег может проводиться на дистанции, скажем, 50, 60 или 100 м; подтягивания можно выполнять на кольцах или перекладине, хватом сверху или снизу и т.п. В таких случаях может использоваться так называемый метод параллельных форм, когда испытуемым предлагают выполнить две разновидности одного и того же теста и затем оценивают степень совпадения результатов. Схема тестирования здесь следующая:

МИНИМАЛЬНЫЙ

ФОРМА А Эквивалентность теста - student2.ru ФОРМА Б

ВРЕМЕННОЙ ИНТЕРВАЛ

Рассчитанный между результатами тестирования коэффициент корреляции называют коэффициентом эквивалентности. Отношение к эквивалентности тестов зависит от конкретной ситуации. С одной стороны, если два или больше тестов эквивалентны, их совместное применение повышает надежность оценок; с другой – может оказаться полезным применять только один эквивалентный тест: это упростит тестирование и лишь незначительно снизит информативность батареи тестов. Решение этого вопроса зависит от таких причин, как сложность и громоздкость тестов, степень необходимой точности тестирования и т.п.

Если же тесты, входящие в какой-либо комплекс тестов, высокоэквивалентны, он называется гомогенным. Весь этот комплекс измеряет одно какое-то свойство моторики человека. Скажем, комплекс, состоящий из прыжков с места в длину, вверх и тройного, вероятно, будет гомогенным. Наоборот, если в комплексе нет эквивалентных тестов, то все тесты, входящие в него, измеряют разные свойства. Такой комплекс называется гетерогенным. Пример гетерогенной батареи тестов: подтягивание на перекладине, наклон вперед (для проверки гибкости), бег на 1500 м.

3.3.5. Пути повышения надежности теста.

Надежность тестов может быть повышена до определенной степени путем:

а) более строгой стандартизации тестирования;

б) увеличения числа попыток;

в) увеличения числа оценщиков (судей, экспертов) и повышения согласованности их мнений;

г) увеличения числа эквивалентных тестов;

д) лучшей мотивации испытуемых.

Среди упомянутых путей следует выделить, отличающееся высокой эффективностью, повышение надежности путем увеличения длины теста. Удлинение теста достигается увеличением числа попыток, числа испытуемых и того и другого вместе.

При увеличении длины теста в m раз надежность теста rtt возрастает до величины r0tt, приближенно равной:

m * rtt

r0tt = – – – – – – .

1 + (m - 1) rtt

Из этой формулы можно определить, во сколько раз нужно увеличить тест, чтобы получить желаемую надежность r0tt:

r0tt (1 - rtt)

m = – – – – – .

rtt (1 - r0tt)

Очевидно, что целесообразно повышать длину теста лишь при не слишком больших величинах m. При значениях m, трудно реализуемых практически, лучше ненадежный тест заменить другим, более надежным.

Образец отчета на III этапе игры

ОТЧЕТ

о работе на III этапе игры

Тема: Оценка надежности теста для контроля за развитием скоростных качеств.

Цели:

1. Ознакомиться с основами теории корреляции.

2. Ознакомиться с основами теории проверки статистических гипотез.

3. Ознакомиться с основами теории надежности тестов.

4. Приобрести навыки вычисления показателя надежности (стабильности) теста.

Краткие теоретические сведения.

Примечание: В этом разделе отчета студент, внимательно прочитав теоретические сведения, в письменной форме отвечает на следующие вопросы:

1. Основы теории корреляции:

1.1. Функциональная зависимость.

1.2. Статистическая зависимость.

1.3. Основные задачи теории корреляции.

1.4. Корреляционное поле.

1.5. Формы корреляционной зависимости.

1.6. Коэффициент корреляции.

1.7. Направленность корреляционной взаимосвязи.

1.8. Коэффициент корреляции Бравэ-Пирсона.

2. Статистические гипотезы.

3. Критерии проверки статистических гипотез.

4. Уровень значимости.

5. Надежность тестов.

6. Стабильность тестов.

7. Согласованность тестов.

8. Эквивалентность тестов.

9. Пути повышения надежности тестов.

Работа на III этапе игры.

Так как результаты тестирования измерены в шкале отношений, а число попыток (исходное и повторное тестирования) равно двум, для оценки надежности (стабильности) теста выберем парный коэффициент корреляции Бравэ-Пирсона rАБ, рассчитываемый по формуле:

S(DtiА - DtА) (DtiБ - DtБ)

rАБ = – – – – – – – – – – – – .

ÖS(DtiА - DtА)2 S(DtiБ - DtБ)2

Пользуясь данными, полученными на I и II этапах игры, составим таблицу 3.1 для расчета показателя надежности (стабильности) теста.

Таблица 3.1. Расчет показателя надежности теста.

№ п/п тест А, DtiА, мс Ретест Б, DtiБ, мс DtiА-DtА, мс (DtiА - DtА)2, мс2 DtiБ - DtБ, мс (DtiБ - DtБ)2, мс2 (DtiА - DtА) * * (DtiБ - DtБ), мс2
-4 -228
-4 -268
-4 -13
-14 -3
-33 -198
-4 -13
-4 -28
-33 -528
-43 -258
  S=2040 S=1730   S=640   S=12210 S=-1330

Подсчитаем величину показателя надежности (стабильности):

S(DtiА - DtА) (DtiБ - DtБ)

rАБ = – – – – – – – – – – – – =

ÖS(DtiА - DtА)2 S(DtiБ - DtБ)2

-1330

= – – – – – = -0,47

Ö640*12210

Найденную величину rАБ проверим с помощью расчетов на программируемом калькуляторе МК-56, пользуясь следующей программой:

Стандартная программа для вычисления коэффициента корреляции

1. Перейдем в режим «Программирование» нажатием кнопок F, ПРГ.

2. Занести в память микроЭВМ программу:

Адрес Команда Код Адрес Команда Код Адрес Команда Код
Сx +
x®П, 1 x®П, 5 П®x, 2
x®П, 3 П®x, 7 П®x, 3
x®П, 4 F, x2 x
x®П, 5 П®x, 4 -
x®П, 6 + П®x, 4
x®П, 2 x®П, 4 П®x, 2
с/п К,П®x,6 Г6 F, x2
x®П, 8 П®x, 7 -
« П®x, 2 x®П, 4
x®П, 7 + П®x, 5
X БП П®x, 3
П®x, 1 F, x2
+ -
x®П, 1 x®П, 0 x®П, 5
П®x, 8 П®x, 0 х
П®x, 3 x®П,В­ F, Ö
+ К,П®x,В­ ГЕ ¸
x®П, 3 П®x, 6 x®П, 0
П®x, 8 ¸ с/п
F, x2 К,x®П,В­ LE      
П®x, 5 F, L0      

3. Перейти в автоматический режим нажатием кнопок F, АВТ.

4. Нажать кнопки в/о, с/п.

5. Занести пару чисел DtiА и DtiБ, разбив их командой В­, нажать кнопку с/п.

6. После занесения всех десяти пар чисел нажать кнопки БП, 35, с/пи вычислить коэффициент корреляции rАБ.

Для оценки надежности теста воспользуемся таблицей 3.2.

Таблица 3.2. Качество надежности теста.

Величина показателя надежности коэффициента корреляции 0,99 – 0,95 0,94 – 0,90 0,89 – 0,80 0,79 – 0,70 0,69 и ниже
Надежность Отлич-ная Хоро-шая Удовлет-воритель-ная Сомни-тельная Плохая

Вывод: Так как ½rАБ½ < 0,69, надежность (стабильность) теста плохая.

Оценим статистическую достоверность показателя надежности. Для этого сравним наблюдаемое и критическое значения коэффициента корреляции. Последнее найдем в таблице 3.3.

Таблица 3.3. Критические точки распределения коэффициента корреляции для односторонней критической области при a = 0,05

n
rкрит 0,988 0,900 0,805 0,729 0,669 0,621 0,582 0,549

Таблица односторонней критической области используется потому, что нулевой гипотезе H0: rген = 0, естественно противопоставить конкурирующую гипотезу H1: rген>0, так как предположение об отрицательной надежности (rген<0) противоречит здравому смыслу.

Итак, для нашего случая rкрит = 0,549.

Вывод: Так как ½rнабл½ (0,47) < rкрит (0,549), показатель надежности (стабильности) теста для данной группы «стрелков» статистически недостоверен с вероятностью более 0,95.

Тест с плохой надежностью недопустимо использовать для контроля за развитием у спортсменов скоростных качеств. Поэтому повысим надежность теста до удовлетворительного уровня (rАБ = 0,80) путем его удлинения.

Определим, во сколько раз надо увеличить число испытуемых или число попыток при тестировании:

r0АБ (1 - ½rАБ½) 0,80 (1 - 0,47) 1,176

m = – – – – – – – = – – – – – – – = – – – = 1,39.

½r АБ½(1 - r0 АБ) 0,47 (1 - 0,80) 0,846

Требуемое число испытуемых равно m * n = 1,39 * 10 = 13,9 @ 14.

Требуемое число попыток получим m * k = 1,39 * 2 = 2,78 @ 3.

Наши рекомендации