Пути повышения надежности теста

Надежность тестов может быть повышена до определенной степени путем:

а) более строгой стандартизации тестирования;

б) увеличения числа попыток;

в) увеличения числа оценщиков (судей, экспертов) и повышения согласованности их мнений;

г) увеличения числа эквивалентных тестов;

д) лучшей мотивации испытуемых.

Среди упомянутых путей следует выделить отличающееся высокой эффективностью повышение надежности путем увеличения длины теста. Удлинение теста достигается увеличением числа попыток, числа испытуемых или того и другого вместе.

При увеличении длины теста в m раз надежность теста r_tt возрастает до величины r⁰_tt, приближенно равной:

Пути повышения надежности теста - student2.ru

Из этой формулы можно определить, во сколько раз нужно увеличить тест, чтобы получить желаемую надежность r⁰_tt:

Пути повышения надежности теста - student2.ru

Очевидно, что целесообразно повышать длину теста лишь при не слишком больших величинах m. При значениях m, трудно реализуемых практически, лучше ненадежный тест заменить другим, более надежным.

Порядок работы на III этапе

Отчет
о работе на III этапе игры
(образец)

Тема: Оценка надежности теста для контроля за развитием скоростных качеств.

Цели:

1. Ознакомиться с основами теории корреляции.

2. Ознакомиться с основами теории проверки статистических гипотез.

3. Ознакомиться с основами теории надежности тестов.

4. Приобрести навыки вычисления показателя надежности (стабильности) теста.

Вопросы:

1. Основы теории корреляции:

1.1. Функциональная зависимость.

1.2. Статистическая зависимость.

1.3. Основные задачи теории корреляции.

1.4. Корреляционное поле.

1.5. Формы корреляционной зависимости.

1.6. Коэффициент корреляции.

1.7. Направленность корреляционной взаимосвязи.

1.8. Коэффициент корреляции Бравэ-Пирсона.

2. Статистические гипотезы.

2.1. Определение статистической гипотезы, примеры.

2.2. Критерии проверки статистических гипотез.

2.3. Ошибки первого и второго рода.

2.4. Уровень значимости.

3. Основы теории надежности тестов.

3.1. Показатель надёжности тестов.

3.2. Стабильность тестов.

3.3. Согласованность тестов.

3.4. Эквивалентность тестов.

3.5. Пути повышения надежности тестов.

Корреляционное поле

Представим взаимосвязь результатов измерения теста А и ретеста Б в виде графика, для чего в прямоугольной системе координат построим корреляционное поле. Результаты теста А будем откладывать по оси абсцисс, а результаты теста Б по оси ординат.

Для наглядности построим график в системе координат, смещенной относительно нуля. Выберем масштаб, позволяющий нанести на график все исходные данные. М: 1 см ≡ 10 мс.

Пути повышения надежности теста - student2.ru

Так как результаты тестирования измерены в шкале отношений, а число попыток (исходное и повторное тестирования) равно двум, для оценки надежности (стабильности) теста выберем парный коэффициент корреляции Бравэ-Пирсона r_АБ, рассчитываемый по формуле:

Пути повышения надежности теста - student2.ru

Пользуясь данными, полученными на I и II этапах игры, составим таблицу 3.2 для расчета показателя надежности (стабильности) теста.

Таблица 3.2 – Расчет показателя надежности теста

№ п/п	тест А, , мс	Ретест Б, , мс	, мс	, мс²	, мс	, мс²	× × , мс²
			-12		-7

			-34		-34
					-17		-289

			-21		-16
			-14				-112


			-11		-3
	S=1648	S=1565		S=4790		S=3293	S=3056

Подсчитаем величину показателя надежности (стабильности):

Пути повышения надежности теста - student2.ru .

Для оценки надежности теста воспользуемся таблицей 3.3.

Таблица 3.3 – Качество надежности теста

Величина показателя надежности	0,99 – 0,95	0,94 – 0,90	0,89 – 0,80	0,79 – 0,70	0,69 и ниже
Надежность	Отлич-ная	Хоро-шая	Удовлет-воритель-ная	Сомни-тельная	Плохая

Вывод: Так как 0,70 < ½r_АБ½ < 0,79, надежность (стабильность) теста сомнительная.

Оценим статистическую достоверность показателя надежности.

Выдвинем две статистические гипотезы:

– нулевую – Н₀: предполагаем, что показатель надёжности теста статистически недостоверен (r_ген = 0);

– конкурирующую – Н₁: предполагаем, что показатель надёжности теста статистически достоверен (r_ген > 0).

Для сравнения выдвинутых гипотез найдём критическое значение коэффициента корреляции. По таблице критических точек коэффициента корреляции (Приложение 1) для односторонней критической области при n = 10 и α = 0,05 находим r_крит = 0,549. Сравниваем r_набл с r_крит.

Вывод: Так как Пути повышения надежности теста - student2.ru (0,77) > r_крит (0,549), показатель надежности (стабильности) теста для данной группы «спортсменов» статистически достоверен с вероятностью 0,95.

Тест с надежностью ниже удовлетворительной недопустимо использовать для контроля развития у спортсменов скоростных качеств. Поэтому повысим надежность теста до удовлетворительного уровня ( Пути повышения надежности теста - student2.ru = 0,80) путем его удлинения.