Возможности использования критерия
1. Сопоставление выборок по качественно определяемому признаку.
2. Сопоставление выборок по количественно измеряемому признаку.
3. Сопоставление выборок и по уровню, и по распределению признака.
Алгоритм расчета критерия φ*
1. Определить те значения признака, которые будут критерием для разделения испытуемых на тех, у кого есть эффект и нет эффекта. (Если признак измерен количественно, следует использовать критерий λ – Колмогорова–Смирнова для поиска оптимальной точки разделения.)
2. Начертить четырехклеточную таблицу из двух столбцов и двух строк:
Есть эффект 1 выборка | Нет эффекта 1 выборка |
Есть эффект 2 выборка | Нет эффекта 2 выборка |
3. Подсчитать количества значений, соответствующих ячейкам этой таблицы, и занести числа в таблицу. Сумма чисел по строкам должна совпадать с объемом первой и второй выборки - соответственно.
4. Подсчитать процентные доли значений, имеющих эффект для первой и второй выборки путем деления содержимого ячеек левого столбца на объем соответствующей выборки. Подписать к таблице (например, в скобках) полученные числа, расположив их в соответствующих местах:
Есть эффект 1 выборка (……….%) | Нет эффекта 1 выборка |
Есть эффект 2 выборка (……….%) | Нет эффекта 2 выборка |
5. Проверить, не равняется ли одна из сопоставляемых долей нулю.
6. Определить из справочных таблиц или по формуле φ = arcsin (√ P) значение угла для каждой из сопоставляемых процентных долей.
7. Подсчитать эмпирическое значение φ*по формуле:
φ* = (φ1 – φ2) √ n1 n2 / (n1 + n2)
8. По таблицам сопоставить результат с критическим значением.
Угловое преобразование Фишера позволяет перевести процентные доли, имеющие распределение, отличное от нормального, в величину углаφ. Это распределение уже близко к нормальному, и позволяет использовать параметрические методы статистического анализа.
Биномиальный критерий m
Критерий предназначен для сопоставления частоты встречаемости какого-либо эффекта с теоретической или заданной частотой его встречаемости.
Он применяется в тех случаях, когда обследована лишь одна выборка объемом не более 300 наблюдений, в некоторых задачах - не больше 50 наблюдений.
Биномиальный критерий m позволяет оценить, насколько эмпирическая частота интересующего нас эффекта превышаеттеоретическую, среднестатистическую или какую-то заданную частоту, соответствующую вероятности случайного угадывания, среднему проценту успешности в выполнении данного задания, допустимому проценту брака и т.п.
Биномиальный критерий незаменим, если налицо 2 условия:
а) обследована лишь одна выборка испытуемых, и нет возможности или смысла делить эту выборку на две части с целью дальнейшего применения критерия, φ*, так как для нас по каким-то причинам важно исследовать частоту встречаемости признака в выборке в целом;
б) в обследованной выборке менее 30 испытуемых, что не позволяет нам применить критерий χ2.
Если в нашей выборке больше 30 испытуемых, мы все же можем использовать критерий m и тем самым сэкономить время на подсчете χ2.
Эмпирическая частота наблюдений, в которых проявляется интересующий нас эффект, обозначается как т. Это и есть эмпирическое [значение критерия т. Если mэмп равен или превышает mкр, то различия достоверны.
Гипотезы
H0: Частота встречаемости данного эффекта в обследованной выборке не превышает теоретической (заданной, ожидаемой, предполагаемой).
H1: Частота встречаемости данного эффекта в обследованной выборке превышает теоретическую (заданную, ожидаемую, предполагаемую).