Многофункциональные критерии
Под многофункциональными критериями понимаются те, которые можно использовать для решения разнообразных задач, где данные могут быть изменены в любой шкале, а выборки могут быть зависимыми и независимыми.
Суть многофункциональных критериев состоит в определении того, какая часть наблюдений в данной выборке характеризуется «эффектом», интересующим исследователя, а какая – нет.
В качестве «эффекта» могут быть взяты:
1. определенное значение качественно измеренного признака (согласен – не согласен; выбрал - не выбрал; мужской пол - женский пол; имеется свойство - отсутствует и т.д.);
2. определенный уровень количественно измеренного признака (получил оценку выше - ниже проходного бала; выполнил задачу быстрее чем за одну минуту - медленнее и т.д.).
4.4.3. Угловой φ-критерий Фишера
Назначение: угловой φ - критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости некоторого эффекта, интересующего исследователя. Особенно удобно его использовать при проверке "отсутствия - наличия эффекта" при сравнении контрольной и экспериментальной групп.
Ограничения:
Если n1и n2 - объемы выборок, то n1 ≥5, n2≥5. Допускаются также случаи:
а) n1 =2, n2≥30;
б) n1 =3, n2≥7;
в) n1 =4, n2≥5.
Ни одна из сопоставляемых долей в каждой выборке не должна быть равна нулю.
Алгоритм использования:
1) Проверить выполнимость ограничений для n1и n2;.
2) Определить значения признака, которые будут делить испытуемых на тех, у которых «есть эффект»и «нет эффекта».Подсчитать количество таких испытуемых в I и II группах. Занести данные в таблицу.
«есть эффект» | «нет эффекта» | сумма | |
Гр. I | a | b | a+b |
Гр. II | c | d | c+d |
a+c | b+d | a+b+ c+d |
3) Проверить совпадение контрольных сумм
a + b + c + d = n1 + n2
4) Подсчитать процентные доли испытуемых, у которых «есть эффект» и «нет эффекта» в обеих выборках и занести в таблицу.
«есть эффект» (%) | «нет эффекта» (%) | |
Гр. I | m % | k % |
Гр. II | p % | q % |
Проверить, не равны ли некоторые процентные доли нулю. Если одна из долей равна нулю, то можно сдвинуть точку деления признака на две группы.
5) Сформулировать гипотезы:
H0: Доля испытуемых, у которых «есть эффект» в выборке I не выше доли испытуемых в выборке II.
Н1: Доля испытуемых, у которых «есть эффект» в выборке I выше доли испытуемых в выборке II.
По таблице найти величины углов φ1 и φ2 для процентной доли тех, у кого «есть эффект» в каждой группе.
6) Подсчитать эмпирическое значение критерия по формуле:
7) По таблице V определить р-уровень значимости различий для полученных процентных долей. Для контроля сравнить φэмп. (р≤0,05)=1,64 и φкр (р≤0,01)=2,31. [ 18, С.74-76].
Ось значимости:
Если φэмп.≥ φкр. на некотором уровне значимости, то Но отвергается на этом уровне значимости.
Если φэмп.<φкр. (р≤0,05), то принимается Но.
Пример:
Имеются две группы детей из параллельных средних групп детского сада, одна из них – экспериментальная, другая контрольная.
В экспериментальной группе проводилась работа по развитию пространственных представлений по новой методике, в контрольной группе – по обычной методике. После этого в обеих группах давалась задача на прохождение лабиринта. В экспериментальной группе из 20 человек с заданием справились 12, а в контрольной группе – 10. Достоверно ли различаются результаты в этих группах?
Параметрические критерии
С помощью параметрических критериев чаще всего решаются следующие задачи:
Задача I:
Установление сходства-различия двух дисперсий D1 и D2 в двух выборках.
Задача II:
Установление сходства-различия средних арифметических (М1 и М2) двух выборок или двух эмпирических распределений.
Задача III:
Установление отличия от нуля некоторых мер связи.
F-критерий Фишера
Назначение:F-критерий Фишера – параметрический критерий, наиболее часто применяется для решения задачи II, то есть установления сходства-различия двух дисперсий в двух независимых выборках.
Ограничения:
1) Выборки должны быть независимыми.
2) Для выборки с большей дисперсией должны выполняться неравенства 2≤n≤51, для выборки с меньшей дисперсией – неравенства 11≤n≤51.
Алгоритм использования:
1) Проверить, являются ли выборки независимыми.
2) Найти дисперсии для каждой выборки. Пусть D1 – большая дисперсия, D2 – меньшая дисперсия. Найти число степеней свободы: v1=n1-1, v2=n2-1, где n1 – объем выборки с большей дисперсией, а n2 – объем выборки с меньшей дисперсией. Выборку с большей дисперсией считать первой, а выборку с меньшей дисперсией – второй.
3) Сформулировать гипотезы
Н0: различия между дисперсиями выборок I и II случайны.
Н1: Различия между дисперсиями выборок I и II не случайны.
4) Найти эмпирическое значение критерия
Fэмп.= D1: D2
5) По таблице и по числу степеней свободы для числителя (выборки I) и знаменателя (выборки II) найти Fкр. (р≤0,05) и Fкр.(р≤0,01)
Если Fэмп.≥Fкр. на некотором уровне значимости, то Н0 отклоняется и принимается Н1 на этом уровне значимости, то есть различия между дисперсиями обеих групп статистически значимы.
Если Fэмп.<Fкр. (р≤0,05) и подавно Fэмп. <Fкр. (р≤0,01), то принимается H0, то есть различия между дисперсиями случайны.
Пример.
Две группы студентов (две независимые выборки обучались по двум различным методикам. До обучения их результаты имели одинаковый разброс (то есть дисперсии примерно равны), после обучения дисперсии были таковы: в одной группе (21 человек) дисперсия равна 16, а в другой группе (16 человек) дисперсия равна 36.
Какая из методик дает большее выравнивание результатов внутри группы?
T-критерий Стьюдента
Назначение:t-критерий Стьюдента – параметрический критерий, наиболее часто применяется для установления сходства-различия значений, измеренных для двух выборок (зависимых и независимых).
Ограничения:
Желательно, чтобы обе выборки были извлечены из нормальных распределений. В практике это пожелание часто опускается.
Если выборки независимы, то число v=n1+n2-2, называемое числом степеней свободы, должно быть таким: 1≤v≤350, где n1 n2 – объемы выборки I и выборки II соответственно.
Если выборки зависимы, то их объемы берутся равными, и число степеней свободы v=n-1 удовлетворяет аналогичному условию 1≤v≤350, где n – объем каждой выборки.
Заметим, что под числом степеней свободы в статистике понимают количество возможных направлений изменчивости некоторой переменной.
Алгоритм использования:
а) для независимых выборок
1) Проверить, являются ли выборки (Xi) и (Yi) независимыми, найти число степеней свободы
v=n1+n2-2.
Проверить, выполняются ли неравенства
1≤v≤350.
2) Найти в каждой выборке М1, М2, D1, D2.
M = 1/n (x1+ x2 + x3 + … + xn)
D = 1/(n-1) ((x1 - M)²+ (x2 - M)²+ (x3 - M)²+ … (xn - M)² )
Для удобства вычислений записать данные и результаты расчетов в таблицу.
n | xi | xi-M1 | (xi-M1)2 | yi | yi-Mi | (yi-Mi)2 |
… | ||||||
Σ | Σ xi | Σ (xi-M1) | Σ (xi-M1)2 | Σ yi | Σ (yi-Mi) | Σ (yi-Mi)2 |
3) Сформулировать гипотезы:
Но: Различия между средними арифметическими М1 и М2 выборок I и II случайны.
Н1: Различия между средними арифметическими М1 и М2 выборок I и II не случайны.
4) Найти эмпирическое значение t-критерия Стьюдента по формуле:
Если tэмп ≥ tкр на некотором уровне значимости, то H0 отклоняется на этом уровне значимости, то есть различия между средними арифметическими значениями выборок I и II статистически значимы на данном уровне значимости.
Если tэмп < tкр (p≤0,05), то принимается H0 и различия между средними арифметическими значениями случайны.
Пример.
В одной и той же группе испытуемых произведены два замера (констатирующий и формирующий эксперименты) уровня развития скоростно-силовых качеств с использованием теста «Прыжок в длину с места толчком двух ног». Можно ли считать методику эффективной, если результаты таковы:
Сентябрь: 143;130;110;115;130;110;150;135;132;130;
Март: 145;131;115;120;133;120;150;137;132;130.
Решение: Примерим алгоритм t-критерия.
1) Выборки зависимы, так как эти замеры сняты у одних и тех же испытуемых.
Найдем
2) Поместим данные в таблицу и сделаем расчеты:
3) Сформулируем гипотезы:
Различия между значениями уровня развития скоростно-силовых качеств «до» и «после» обучения случайны.
Различия между значениями уровня развития скоростно-силовых качеств «до» и «после» обучения не случайны.
4) Найдем эмпирические значения t-критерия Стьюдента
4) Найдем критические значения t-критерия по таблице и значению
КГ | ||||
сентябрь | март | |||
n | ||||
Изобразим все значения на оси значимости:
| ||||||
2,262 | 2,81 | 3,250 | 4,871 | |||
, так как 2,81 2,262, то принимается с уровнем значимости =0,05, т.е. различия между значениями «до» и «после» обучения не случайны (статистически значимы) с вероятностью
Ответ: различия между значениями теста на уровень развития скоростно-силовых качеств статистически значимы.