Сравнение двух выборок по количественно определенному признаку
Критерий Фишера с равным успехом может использоваться и при сравнении распределений количественных признаков.
Задача 8.15.Будет ли уровень тревожности у подростков-сирот более высоким, чем у их сверстников из полных семей? Для решения этой задачи психолог проводил анализ выраженности уровня тревожности в группе сирот и в группе детей из полных семей при помощи опросника Тейлора. 40 баллов и выше рассматривались как показатель очень высокого уровня тревоги (
Решение. В первой группе из 10 человек очень высокий уровень тревожности наблюдался у 7 испытуемых (70%), во второй группе из 13 человек он был обнаружен у 3 испытуемых (23,1%). Проверим, можно ли считать подобные различия статистически значимыми?
По таблице 14 Приложения 1 определяем величины и для первой и второй группы:
=1,982 для 70% и = 1,003 для 23,1%.
Подсчитываем по формуле (8.14):
Напомним, что критические величины для этого критерия таковы:
Полученная величина превышает соответствующее критическое значение для уровня в 1%, следовательно, различия между группами значимы на 1% уровне. Иными словами в первой группе измеряемый признак выражен в существенно большей степени, чем во второй.
Т.е. подростки сироты более тревожны, чем дети из полных семей. Обратите внимание, что для получения подобного вывода понадобилась очень малая выборка испытуемых.
В терминах статистических гипотез можно утверждать, что нулевая гипотеза Н0 отклоняется и на высоком уровне значимости принимается гипотеза Н1 о различиях.
Как уже говорилось ранее, критерии носят название «параметрические», потому что в формулу их расчета включаются такие параметры выборки, как среднее, дисперсия и др. Как правило, в психологических исследованиях чаще всего применяются два параметрических критерия — это t- критерий Стьюдента, который оценивает различия средних для двух выборок и F - критерий Фишера, оценивающий различия между двумя дисперсиями.
2.6. - критерий Стьюдента
Критерий t Стьюдента направлен на оценку различий величин средних и двух выборок и , которые распределены по нормальному закону. Одним из главных достоинств критерия является широта его применения. Он может быть использован для сопоставления средних у связных и несвязных выборок, причем выборки могут быть не равны по величине.
Случай несвязных выборок
В общем случае формула для расчета по t-критерию Стьюдента такова:
где
Рассмотрим сначала равночисленные выборки. В этом случае п1= п2 =п, тогда выражение (9.2) будет вычисляться следующим образом:
В случае не равночисленных выборок п1 ≠ п2, выражение (9.2) будет вычисляться следующим образом:
В обоих случаях подсчет числа степеней свободы осуществляется по формуле:
где п1и п2 соответственно величины первой и второй выборки.
Понятно, что при численном равенстве выборок k= 2 · п – 2.
Рассмотрим пример использования t-критерия Стьюдента для несвязных и неравных по численности выборок.
Задача 9.1.Психолог измерял время сложной сенсомоторной реакции выбора (в мс) в контрольной и экспериментальной группах. В экспериментальную группу (X) входили 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающиеся спортом. Психолог проверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем эта же величина у людей, не занимающихся спортом.
Решение. Результаты эксперимента представим в виде таблицы 9.1, в которой произведем ряд необходимых расчетов:
Средние арифметические составляют в экспериментальной
группе , в контрольной группе .
Разница по абсолютной величине между средними
.
Подсчет выражения 9.4 дает:
Тогда значение tэмп, вычисляемое по формуле (9.1), таково:
Число степеней свободы k = 9 + 8-2= 15. По таблице 16 Приложения 1 для данного числа степеней свободы находим:
Таким образом, обнаруженные психологом различия между экспериментальной и контрольной группами значимы более чем на 0,1% уровне, или, иначе говоря, средняя скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше, чем в группе людей, активно не занимающихся спортом.
В терминах статистических гипотез это утверждение звучит так: гипотеза Н0 о сходстве отклоняется и на уровне значимости 0,1% принимается альтернативная гипотеза Н1 - о различии между экспериментальной и контрольными группами.
Случай связных выборок
В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента.
Вычисление значения tэмп осуществляется по формуле:
где
где - разности между соответствующими значениями переменной X ипеременной Y, а среднее этих разностей.
В свою очередь Sd вычисляется по следующей формуле:
Число степеней свободы к определяется по формуле k = n - 1. Рассмотрим пример использования t - критерия Стьюдента для связных, равных по численности выборок.
Задача 9.2.Психолог предположил, что в результате научения время решения эквивалентных задач «игры в 5» (т.е. имеющих один и тот же алгоритм решения) будет значимо уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задач.
Решение. Решение задачи представим в виде таблицы 9.2:
Вначале произведем расчет по формуле (9.7):
Затем применим формулу (9.8), получим:
И, наконец, следует применить формулу (9.6). Получим:
Число степеней свободы: k = 8 – 1 = 7 и по таблице 16 Приложения 1 находим tкр :
Таким образом, на 5% уровне значимости первоначальное предположение подтвердилось, действительно, среднее время решения третьей задачи существенно меньше среднего времени решения первой задачи. В терминах статистических гипотез полученный результат будет звучать так: на 5% уровне гипотеза Н0 отклоняется и принимается гипотеза Н1 — о различиях.
Для применения t-критерия Стъюдента необходимо соблюдать следующие условия:
1. Измерение может быть проведено в шкале интервалов и отношений.
2. Сравниваемые выборки должны быть распределены по нормальному закону.
2.7. F — критерий Фишера
Критерий Фишера позволяет сравнивать величины выборочных дисперсий двух рядов наблюдений. Для вычисления Fэмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе. Формула вычисления по критерию Фишера F такова:
Где
Поскольку, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значение Fэмп всегда будет больше или равно единице, т.е. Fэмп ≥ 1. Число степеней свободы определяется также просто: df1 = п1 - 1 для первой (т.е. для той выборки, величина дисперсии которой больше) и df2 = п2 - 1 для второй выборки. В таблице 17 Приложения 1 критические значения критерия Фишера Fкp находятся по величинам dfx (верхняя строчка таблицы) и df2 (левый столбец таблицы).
Задача 9.3.В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос – есть ли различия в степени однородности показателей умственного развития между классами.
Решение. Для критерия Фишера необходимо сравнить дисперсии тестовых оценок в обоих классах. Результаты тестирования представлены в таблице:
Как видно из таблицы 9.3, величины средних в обеих группах практически совпадают между собой 60,6 ≈ 63,6 и величина t-критерия Стьюдента оказалась равной 0,347 и незначимой.
Рассчитав дисперсии для переменных X и Y, получаем
Тогда по формуле (9.9) для расчета по F критерию Фишера
находим:
По таблице 17 Приложения 1 для F критерия при степенях свободы в обоих случаях равных df = 10 - 1 = 9 находим Fкр .
Таким образом, полученная величина Fэмп попала в зону неопределенности. В терминах статистических гипотез можно утверждать, что Но (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н1. Психолог может утверждать, что по степени однородности такого показателя, как умственное развитие, имеется различие между выборками из двух классов.
Для применения критерия F Фишера необходимо соблюдать следующие условия:
1. Измерение может быть проведено в шкале интервалов и отношений.
2. Сравниваемые выборки должны быть распределены по нормальному закону