Лекция 5. Статистические критерии различий

Лекция 5. Статистические критерии различий

Параметрические и непараметрические критерии. Рекомендации к выбору критерия различия

Все критерии различий условно подразделены на две группы: параметрические и непараметрические критерии.

Критерий различия называют параметрическим, если он основан на конкретном типе распределения генеральной совокупности (как правило, нормальном) или использует параметры этой совокупности (средние, дисперсии и т.д.).

Критерий различия называют непараметрическим, если он не базируется на предположении о типе распределения генеральной совокупности и не использует параметры этой совокупности. Поэтому для непараметрических критериев предлагается также использовать такой термин как «критерий, свободный от распределения».

При нормальном распределении генеральной совокупности параметрические критерии обладают большей мощностью по сравнению с непараметрическими. Иными словами, они спо­собны с большей достоверностью отвергать нулевую гипотезу, если последняя неверна. По этой причине в тех случаях, когда выборки взяты из нормально распределенных генеральных со­вокупностей, следует отдавать предпочтение параметрическим критериям.

Однако, как показывает практика, подавляющее большинство данных, получаемых в психологических экспериментах, не распределены нормально, поэтому применение параметрических критериев при анализе результатов психологических исследований может привести к ошибкам в статистических выводах. В таких случаях непараметрические критерии оказываются более мощными, т.е. способными с большей достоверностью отвергать нулевую гипотезу.

Итак, при оценке различий в распределениях, далеких от нормального, непараметрические критерии могут выявить значимые различия, в то время как параметрические критерии таких различий не обнаружат.

Важно отметить, что,

во-первых, непараметрические критерии выявляют значимые различия и в том случае, если распределение близко к нормальному;

во-вторых, при вычислениях вручную непараметрические критерии являются значительно менее трудоемкими, чем параметрические.

При подготовке экспериментального исследования психолог должен заранее запланировать характеристики сопоставляемых выборок (прежде всего связность–несвязность и однородность), их величину (объем), тип измерительной шкалы и вид используемого критерия различий. Последовательно это можно представить в виде следующих этапов:

1. Прежде всего, следует определить, является ли выборка связной (зависимой) или несвязной (независимой).

2. Следует определить однородность–неоднородность выборки.

3. Затем следует оценить объем выборки и, зная ограничения каждого критерия по объему, выбрать соответствующий критерий.

4. При этом целесообразнее всего начинать работу с выбора наименее трудоемкого критерия.

5. Если используемый критерий не выявил различия – следует применить более мощный, но одновременно и более трудоемкий критерий.

6. Если в распоряжении психолога имеется несколько критериев, то следует выбирать те из них, которые наиболее полно используют информацию, содержащуюся в экспериментальных данных.

7. При малом объеме выборки следует увеличивать величину уровня значимости (не менее 1%), так как небольшая выборка и низкий уровень значимости приводят к увеличению вероятности принятия ошибочных решений.

В психологических исследованиях для доказательства эффективности внедряемых программ, тренингов, упражнений и т.д., помимо отслеживания на определенных этапах качественных изменений, используется и математическая статистика.

С помощью математических методов сопоставляются результаты «до» и «после» воздействия, выявляется динамика изменения показателей под влиянием экспериментальных воздействий, сравниваются контрольная и экспериментальная группы, оценивается характер изменения какого-либо психологического показателя в нескольких группах и т.д.

Целью любого педагогического эксперимента является эмпирическое подтверждение или опровержение гипотезы исследования и/или справедливости теоретических результатов, то есть обоснование того, что предлагаемое педагогическое воздействие (например, новые содержание, формы, методы, средства обучения и т.д.) более эффективно (или, возможно, наоборот – менее эффективно).

Для этого, как минимум, необходимо показать, что, будучи примененным к тому же объекту (например – к группе учащихся), оно дает другие результаты, чем применение традиционных педагогических воздействий.

Для этого выделяется экспериментальная группа, которая сравнивается с контрольной группой.

Различие эффектов педагогических воздействий будет обосновано, если две эти группы, первоначально совпадающие по своим характеристикам, различаются после реализации педагогических воздействий.

Следовательно, требуется провести два сравнения и показать, что при первом сравнении (до начала педагогического эксперимента) характеристики экспериментальной и контрольной группы совпадают, а при втором (после окончания эксперимента) – различаются.

Так как объектом педагогического эксперимента, как правило, являются люди (учащиеся, учителя, сотрудники и руководители органов управления образованием и т.д.), а каждый человек индивидуален, то говорить о совпадении или различии характеристик экспериментальной и контрольной групп можно лишь в чисто формальном, статистическом смысле. Для того, чтобы выяснить, являются ли совпадения или различия случайными, используются статистические методы, которые позволяют на основании данных, полученных в результате эксперимента, принять обоснованное решение о совпадениях или различиях.

Общий алгоритм использования статистических критериев прост: до начала и после окончания эксперимента на основании информации о результатах наблюдений (характеристиках членов экспериментальной и контрольной группы) вычисляется эмпирическое значение критерия (алгоритм выбора статистического критерия и формулы для вычислений приведены ниже). Это число сравнивается с известным (табличным) числом – критическим значением критерия (критические значения для всех рекомендуемых нами критериев приведены ниже). Если эмпирическое значение критерия попадает в зону незначимости, , то можно утверждать, что "характеристики экспериментальной и контрольной групп совпадают с уровнем значимости 0,05 по статистическому критерию …(далее следует название использованного критерия: Крамера-Уэлча, Вилкоксона-Манна-Уитни, хи-квадрат, Фишера)".

В противном случае (если эмпирическое значение критерия оказывается вне зоны незначимости), можно утверждать, что "достоверность различий характеристик экспериментальной и контрольной групп по статистическому критерию … равна 95%".__

Следовательно, если характеристики экспериментальной и контрольной групп до начала эксперимента совпадают с уровнем значимости 0,05, и, одновременно с этим, достоверность различий характеристик экспериментальной и контрольной групп после эксперимента равна 95%, то можно сделать вывод, что "применение предлагаемого педагогического воздействия(например, новой методики обучения) приводит к статистически значимым (на уровне 95% по критерию …) отличиям результатов".

Важно!!! Если до начала эксперимента выявлено статистически значимое различие характеристик экспериментальной и контрольной групп по интересующему исследователя критерию (например, по успеваемости), то проводить эксперимент не имеет смысла, так как никакие результаты сравнения характеристик этих групп после окончания эксперимента, не позволят выявить вклада педагогического воздействия, сравниваемого с традиционным.

Назначение критерия

Критерий используется для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых.

Описание критерия

Это очень простой непараметрический критерий, который позволяет быстро оценить различия между двумя выборками по какому-либо признаку. Но если критерий Лекция 5. Статистические критерии различий - student2.ru не выявляет достоверных различий, это еще не означает, что их действительно нет.

В этом случае стоит применить критерий Лекция 5. Статистические критерии различий - student2.ru Фишера. Если же Лекция 5. Статистические критерии различий - student2.ru - критерий выявляет достоверные различия между выборками с уровнем значимости Лекция 5. Статистические критерии различий - student2.ru ,можно ограничиться только им и избежать трудностей применения других критериев.

Критерий применяется в тех случаях, когда данные представлены, по крайней мере, в порядковой шкале. Признак должен варьировать в каком-то диапазоне, иначе сопоставления с помощью Лекция 5. Статистические критерии различий - student2.ru -критерия просто невозможны.

Применение критерия начинают с того, что упорядочивают значения признака в обеих выборках по нарастанию (или убыванию) признака. Лучше всего, если данные каждого испытуемого представлены на отдельной карточке. Тогда ничего не стоит упорядочить два ряда значений по интересующему нас признаку, раскладывая карточки на столе. При этом сразу видно, совпадают ли диапазоны значений, и если нет, то насколько один ряд значений «выше» Лекция 5. Статистические критерии различий - student2.ru , а второй – «ниже» Лекция 5. Статистические критерии различий - student2.ru . Для того, чтобы не запутаться, в этом и во многих других критериях рекомендуется первым рядом (выборкой, группой) считать тот ряд, где значения выше, а вторым рядом – тот, где значения ниже.

Гипотезы

Лекция 5. Статистические критерии различий - student2.ru : Уровень признака в выборке 1 не превышает уровня признака в выборке 2.

Лекция 5. Статистические критерии различий - student2.ru : Уровень признака в выборке 1 превышает уровень признака в выборке 2.

Для использования критерия Лекция 5. Статистические критерии различий - student2.ru необходимо соблюдать следующие условия:

1. Измерение может быть проведено в шкале порядка, интервалов и отношений.

2. Выборки должны быть независимыми.

3. В каждой из выборок должно быть не меньше 11 испытуемых.

4. Приведенная в настоящем пособии таблица ограничивает верхний предел выборки 26 испытуемыми.

5. При числе наблюдений Лекция 5. Статистические критерии различий - student2.ru можно пользоваться следующими величинами Лекция 5. Статистические критерии различий - student2.ru :

Лекция 5. Статистические критерии различий - student2.ru

6. Принципиальным условием, дающим возможность применять критерий, является наличие «хвостов» в сравниваемых рядах (см. задачу). В случае расположения выборок следующим образом:

х х х х х х х х х х х х х х

у у у у у у у

критерий Лекция 5. Статистические критерии различий - student2.ru оказывается неприменим. Следует использовать критерий U.

Работа с критерием Розенбаума предполагает подсчет так называемых «хвостов». Потому этот критерий имеет также название — «критерий хвостов». Что же такое «хвост»?

В случае, если в сравниваемых рядах будут равные элементы, их следует размещать точно друг под другом. В этом случае два сравниваемых ряда можно расположить друг под другом следующим способом:

Лекция 5. Статистические критерии различий - student2.ru |t t t t| t t t t t t

z z z z |z z z z| Лекция 5. Статистические критерии различий - student2.ru

Символы Лекция 5. Статистические критерии различий - student2.ru и Лекция 5. Статистические критерии различий - student2.ru обозначают соответственно правый и левый «хвосты», причем, Лекция 5. Статистические критерии различий - student2.ru , а Лекция 5. Статистические критерии различий - student2.ru .

Лекция 5. Статистические критерии различий - student2.ru подсчитывается очень просто - это сумма величин Лекция 5. Статистические критерии различий - student2.ru и Лекция 5. Статистические критерии различий - student2.ru , т.е.

Лекция 5. Статистические критерии различий - student2.ru

После подсчета сумм "хвостов" следует обратиться к таблице 8 Приложения в соответствии с количеством испытуемых в сравниваемых выборках. Когда сумма Лекция 5. Статистические критерии различий - student2.ru достаточно велика, можно считать различия сравниваемых выборок значимыми.

Алгоритм

подсчета критерия Лекция 5. Статистические критерии различий - student2.ru Розенбаума

1. Проверить, выполняются ли ограничения: Лекция 5. Статистические критерии различий - student2.ru .

2. Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше (правее), а выборкой 2 – ту, где значения предположительно ниже (левее).

3. Определить самое высокое (максимальное) значение в выборке 2.

4. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как Лекция 5. Статистические критерии различий - student2.ru .

5. Определить самое низкое (минимальное) значение в выборке 1.

6. Подсчитать количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как Лекция 5. Статистические критерии различий - student2.ru .

7. Посчитать Лекция 5. Статистические критерии различий - student2.ru по формуле: Лекция 5. Статистические критерии различий - student2.ru

8. По таблице 8 Приложения определить Лекция 5. Статистические критерии различий - student2.ru для данных Лекция 5. Статистические критерии различий - student2.ru и Лекция 5. Статистические критерии различий - student2.ru . Если Лекция 5. Статистические критерии различий - student2.ru , то Лекция 5. Статистические критерии различий - student2.ru - отвергается.

9. При Лекция 5. Статистические критерии различий - student2.ru сопоставить полученное Лекция 5. Статистические критерии различий - student2.ru с Лекция 5. Статистические критерии различий - student2.ru Если Лекция 5. Статистические критерии различий - student2.ru превышает или, по крайней мере, равняется Лекция 5. Статистические критерии различий - student2.ru , то Лекция 5. Статистические критерии различий - student2.ru - отвергается.

2.2. Критерий U Вилкоксона-Манна-Уитни

Назначение критерия

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различие между малыми выборками, когда Лекция 5. Статистические критерии различий - student2.ru или Лекция 5. Статистические критерии различий - student2.ru и является более мощным, чем критерий Розенбаума.

Описание критерия

Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам.

Этот способ определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (1-м рядом, выборкой, группой называется ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом – тот, где они предположительно ниже).

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.

Эмпирическое значение критерия Лекция 5. Статистические критерии различий - student2.ru отражает то, насколько велика зона совпадения между рядами. Поэтому, чем меньше Лекция 5. Статистические критерии различий - student2.ru , тем более вероятно, что различия достоверны.

Гипотезы

Лекция 5. Статистические критерии различий - student2.ru : Уровень признака в группе 2 не ниже уровня признака в группе 1.

Лекция 5. Статистические критерии различий - student2.ru : Уровень признака в группе 2 ниже уровня признака в группе 1

Для применения критерия U необходимо соблюдать следующие условия:

1. Измерение должно быть проведено в шкале интервалов и отношений.

2. Выборки должны быть несвязанными.

3. Нижняя граница применимости критерия Лекция 5. Статистические критерии различий - student2.ru или Лекция 5. Статистические критерии различий - student2.ru , а Лекция 5. Статистические критерии различий - student2.ru .

4. Верхняя граница применимости критерия: Лекция 5. Статистические критерии различий - student2.ru .

Замечание. Критерий U применяют и для связных выборок, рассматривая их при этом как независимые. Последнее возможно, если связи внутри генеральной совокупности оказываются слабыми, а различия между двумя связными выборкам – сильными. В этом случае возможно получение значимых различий по критерию U, в то время как критерии, специально пред­назначенные для связанных выборок, могут и не обнаружить значимых различий.

Рассмотрим на примере применение данного критерия.

Задача 1.Две неравные по численности группы испытуемых решали техническую задачу. Показателем успешности служило время решения. Испытуемые меньшей по численности группы получали дополнительную мотивацию в виде денежного вознаграждения. Психолога интересует вопрос – влияет ли вознаграждение на успешность решения задачи?

Психологом были получены следующие результаты времени решения технической задачи в секундах: в первой группе – с дополнительной мотивацией – 39, 38, 44, 6, 25, 25, 30, 43; во второй группе – без дополнительной мотивации – 46, 8, 50, 45, 32, 41, 41, 31, 55. Число испытуемых в первой группе обозначается, как Лекция 5. Статистические критерии различий - student2.ru и равно 8, во – второй, как Лекция 5. Статистические критерии различий - student2.ru и равно 9.

Решение. Для ответа на вопрос задачи применим критерий U - Вилкоксона-Манна-Уитни. Существует два способа подсчета по критерию U. Последовательно рассмотрим оба способа.

Алгоритм

Назначение критерия

Критерий хи-квадрат (другая форма записи – Лекция 5. Статистические критерии различий - student2.ru греческая буква «хи») один из наиболее часто использующихся в психологических исследованиях, поскольку он позволяет решать боль­шое число разных задач, и, кроме того, исходные данные для него могут быть получены в любой шкале, начиная со шкалы наименований.

Критерий хи-квадрат используется в двух вариантах:

· как расчет согласия эмпирического распределения и предполагаемого теоретического; в этом случае проверяется гипотеза Лекция 5. Статистические критерии различий - student2.ru об отсутствии различий между теоретическим и эмпирическим распределениями;

· как расчет однородности двух независимых экспериментальных выборок; в этом случае проверяется гипотеза Лекция 5. Статистические критерии различий - student2.ru об отсутствии различий между двумя (тремя или более) эмпирическими (экспериментальными) распределениями одного и того же признака.

Описание критерия

Критерий Лекция 5. Статистические критерии различий - student2.ru отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.

Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований.

При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теоретическими частотами.

При сопоставлении двух эмпирических распределений мы определяем степень расхождения между эмпирическими частотами и теоретическими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений.

Критерий построен так, что при полном совпадении экспериментального и теоретического (или двух экспериментальных) распределений величина Лекция 5. Статистические критерии различий - student2.ru , и чем больше расхождение между сопоставляемыми распределениями, тем больше величина эмпирического значения хи-квадрат.

Гипотезы

Возможны несколько вариантов гипотез, в зависимости от задач, которые мы перед собой ставим.

Первый вариант:

Лекция 5. Статистические критерии различий - student2.ru : Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения.

Лекция 5. Статистические критерии различий - student2.ru : Полученное эмпирическое распределение признака отличается от теоретического распределения.

Второй вариант:

Лекция 5. Статистические критерии различий - student2.ru : Эмпирическое распределение 1 не отличается от эмпирического распределения 2.

Лекция 5. Статистические критерии различий - student2.ru : Эмпирическое распределение 1 отличается от эмпирического распределения 2.

Третий вариант:

Лекция 5. Статистические критерии различий - student2.ru : Эмпирические распределения 1, 2. 3. … не различаются между собой.

Лекция 5. Статистические критерии различий - student2.ru : Эмпирические распределения 1, 2. 3. … различаются между собой.

Для применения критерия Лекция 5. Статистические критерии различий - student2.ru необходимо соблюдать следующие условия:

1. Измерение может быть проведено в любой шкале.

2. Выборки должны быть случайными и независимыми.

3. Желательно, чтобы объем выборки был ≥ 20. С увеличением объема выборки точность критерия повышается.

4. Теоретическая частота для каждого выборочного интервала не должна быть меньше 5.

5. Сумма наблюдений по всем интервалам должна быть равна общему количеству наблюдений.

6. Таблица критических значений критерия Лекция 5. Статистические критерии различий - student2.ru рассчитана для числа степеней свободы Лекция 5. Статистические критерии различий - student2.ru , которое каждый раз рассчитывается по определенным правилам.

В общем случае число степеней свободы определяется по формуле: Лекция 5. Статистические критерии различий - student2.ru , где с - число альтернатив (признаков, значений, элементов) в сравниваемых переменных.

Для таблиц, число степеней свободы определяется по фор­муле: Лекция 5. Статистические критерии различий - student2.ru , где k - число столбцов, с - число строк.

Назначение критерия

Критерий Лекция 5. Статистические критерии различий - student2.ruпредназначен для сопоставления двух распределений:

а) эмпирического с теоретическим, например, равномерным или нормальным;

б) одного эмпирического распределения с другим эмпирическим распределением.

Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.

Описание критерия

Если в методе Лекция 5. Статистические критерии различий - student2.ru мы сопоставляли частоты двух распределений отдельно по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т.д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты.

Если различия между двумя распределениями существенны, то в какой–то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия Лекция 5. Статистические критерии различий - student2.ruвключается эта разность. Чем больше эмпирическое значение Лекция 5. Статистические критерии различий - student2.ru , тем более существенны различия.

Гипотезы

Лекция 5. Статистические критерии различий - student2.ru Различия между распределениями недостоверны (судя по точке максимального накопленного расхождения между ними).

Лекция 5. Статистические критерии различий - student2.ru : Различия между распределениями достоверны (судя по точке максимального накопленного расхождения между ними).

Для применения критерия Колмогорова–Смирнова необходимо соблюдать следующие условия:

1. Измерение может быть проведено шкале интервалов и отношений.

2. Выборки должны быть случайными и независимыми.

3. Желательно, чтобы суммарный объем двух выборок ≥ 50. С увеличением объема выборки точность критерия повышается.

4. Эмпирические данные должны допускать возможность упорядочения по возрастанию или убыванию какого-либо признака и обязательно отражать какое-то его однонаправленное изменение. В том случае, если трудно соблюсти принцип упорядоченности признака, лучше использовать критерий хи-квадрат.

Этот критерий используется для решения тех же задач, что и критерий xи-квадрат. Иначе говоря, с его помощью можно сра­нивать эмпирическое распределение с теоретическим или два эмпирических распределения друг с другом. Однако если при применении хи-квадрат мы сопоставляем частоты двух распределений, то в данном критерии сравниваются накопленные (кумулятивные) частоты по каждому разряду (альтернативе). При этом если разность накопленных частот в двух распределениях оказывается большой, то различия между двумя распределениями яв­ляются существенными.

Задача 8.12.Предположим, что в эксперименте психологу не­обходимо использовать шестигранный игральный кубик с цифрами на гранях от 1 до 6. Для чистоты эксперимента необходимо получить «идеальный» кубик, т.е. такой, чтобы при достаточно большом числе подбрасываний, каждая его грань выпадала бы примерно равное число раз. Задача состоит в выяснении того, будет ли данный кубик близок к идеальному?

Решение. Подбросим кубик 120 раз и сравним полученное эмпирическое распределение с теоретическим. Поскольку теоретическое распределение является равновероятным, то соответствующие теоретические частоты равны 20. Распределение эмпирических и теоретических частот представим совместно в таблице 8.15:

Лекция 5. Статистические критерии различий - student2.ru

Для подсчета по критерию Колмогорова–Смирнова необхо­димо провести ряд преобразований с данными таблицы 8.15. Представим эти преобразования в таблице 8.16 и объясним их получение:

Лекция 5. Статистические критерии различий - student2.ru

Символом FE в таблице 8.16 будем обозначать накопленные теоретические частоты. В таблице они получаются следующим образом: к первой теоретической частоте 20, добавляется вторая частота, также равная 20, получается число 20 + 20 = 40. Число 40 ставится на место второй частоты. Затем к числу 40 прибавляется следующая теоретическая частота, полученная величина 60 — ставится на место третьей теоретической частоты и так далее.

Символом FB в таблице 8.16 обозначаются накопленные эмпирические частоты. Для их подсчета необходимо расположить эмпирические частоты по возрастанию: 15, 18, 18, 21, 23, 25 и затем по порядку сложить. Так, вначале стоит первая частота равная 15, к ней прибавляется вторая по величине частота и полученная сумма 15 + 18 = 33 ставится на место второй частоты, затем к 33 добавляется 18 (33 + 18 = 51), полученное число 51 ставится на место третьей частоты и т.д.

Символом |FE - FB| в таблице 8.16 обозначаются абсолютные величины разности между теоретической и эмпирической частотой по каждому столбцу отдельно.

Эмпирическую величину этого критерия, которая обозначается как Dэмп получают используя формулу (8.13):

Лекция 5. Статистические критерии различий - student2.ru

Для её получения среди чисел |FE - FB| находят максимальное число (в нашем случае оно равно 9) и делят его на объем выборки п. В нашем случае п = 120, поэтому

Лекция 5. Статистические критерии различий - student2.ru

Для этого критерия таблица с критическими значениями дана в Приложении 1 под № 13. Из таблицы 13 Приложения 1 следует, однако, что в том случае, если число элементов выборке больше 100, то величины критических значений вычисляются по формуле (8.14):

Лекция 5. Статистические критерии различий - student2.ru

Иными словами, вместо привычных табличных значений вычисляются величины Dкр подстановкой величины объема выбор­ки вместо символа п.

В нашем случае п = 120, поэтому Dкр для0,05 равно Лекция 5. Статистические критерии различий - student2.ru

и Dкp для 0,01 равно Лекция 5. Статистические критерии различий - student2.ru , или в привычной форме записи:

Лекция 5. Статистические критерии различий - student2.ru

Лекция 5. Статистические критерии различий - student2.ru

В нашем случае Dэмп оказалось равным 0,075, что гораздо меньше 0,124, иначе говоря, эмпирическое значение критерия Колмогорова-Смирнова попало в зону незначимости. Таким об­разом, гипотеза Н1 отклоняется и принимается гипотеза Лекция 5. Статистические критерии различий - student2.ru о том, что теоретическое и эмпирическое распределения не отличаются между собой. Следовательно, можно с уверенностью утверждать, что наш игральный кубик «безупречен».

2.5. Критерий Лекция 5. Статистические критерии различий - student2.ru - угловое преобразование Фишера

Назначение критерия

Критерий Фишера предназначен для сопоставления двух рядов выборочных значений по частоте встречаемости какого-либо признака. Этот критерий можно применять для оценки различий в любых двух выборках зависимых или независимых. С его помощью можно сравнивать показатели одной и той же выборки, измеренные в разных условиях.

Описание критерия

Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий нас эффект.

Суть углового преобразования Фишера состоит в переводе процентных долей в величины центрального угла, который измеряется в радианах. Большей процентной доле будет соответствовать больший угол Лекция 5. Статистические критерии различий - student2.ru , а меньшей доле – меньший угол,но соотношения здесь не линейные: Лекция 5. Статистические критерии различий - student2.ru , где Лекция 5. Статистические критерии различий - student2.ru - процентная доля, выраженная в долях единицы.

При увеличении расхождения между углами Лекция 5. Статистические критерии различий - student2.ru , Лекция 5. Статистические критерии различий - student2.ru и увеличения численности выборок значение критерия возрастет. Чем больше величина Лекция 5. Статистические критерии различий - student2.ru , тем более вероятно, что различия достоверны.

Гипотезы

Лекция 5. Статистические критерии различий - student2.ru : Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 не больше, чем в выборке 2.

Лекция 5. Статистические критерии различий - student2.ru : Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 больше, чем в выборке 2.

Для применения критерия Фишера Лекция 5. Статистические критерии различий - student2.ru необходимо соблюдать следующие условия:

1. Измерение может быть проведено в любой шкале.

2. Характеристики выборок могут быть любыми.

3. Нижняя граница — в одной из выборок может быть только 2 наблюдения, при этом во второй должно быть не менее 30 наблюдений. Верхняя граница не определена.

4. Нижние границы двух выборок должны содержать не меньше 5 элементов (наблюдений) в каждой.

Случай несвязных выборок

В общем случае формула для расчета по t-критерию Стьюдента такова:

Лекция 5. Статистические критерии различий - student2.ru

где

Лекция 5. Статистические критерии различий - student2.ru

Рассмотрим сначала равночисленные выборки. В этом случае п1= п2 =п, тогда выражение (9.2) будет вычисляться следующим образом:

Лекция 5. Статистические критерии различий - student2.ru

В случае не равночисленных выборок п1 ≠ п2, выражение (9.2) будет вычисляться следующим образом:

Лекция 5. Статистические критерии различий - student2.ru

В обоих случаях подсчет числа степеней свободы осуществля­ется по формуле:

Лекция 5. Статистические критерии различий - student2.ru

где п1и п2 соответственно величины первой и второй выборки.

Понятно, что при численном равенстве выборок k= 2 · п – 2.

Рассмотрим пример использования t-критерия Стьюдента для несвязных и неравных по численности выборок.

Задача 9.1.Психолог измерял время сложной сенсомоторной реакции выбора (в мс) в контрольной и экспериментальной группах. В экспериментальную группу (X) входили 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающиеся спортом. Психолог проверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем эта же величина у людей, не занимающихся спортом.

Решение. Результаты эксперимента представим в виде таблицы 9.1, в которой произведем ряд необходимых расчетов:

Лекция 5. Статистические критерии различий - student2.ru

Средние арифметические составляют в экспериментальной

группе Лекция 5. Статистические критерии различий - student2.ru , в контрольной группе Лекция 5. Статистические критерии различий - student2.ru .

Разница по абсолютной величине между средними

Лекция 5. Статистические критерии различий - student2.ru .

Подсчет выражения 9.4 дает:

Лекция 5. Статистические критерии различий - student2.ru

Тогда значение tэмп, вычисляемое по формуле (9.1), таково:

Лекция 5. Статистические критерии различий - student2.ru

Число степеней свободы k = 9 + 8-2= 15. По таблице 16 Приложения 1 для данного числа степеней свободы находим:

Лекция 5. Статистические критерии различий - student2.ru

Лекция 5. Статистические критерии различий - student2.ru

Таким образом, обнаруженные психологом различия между экспериментальной и контрольной группами значимы более чем на 0,1% уровне, или, иначе говоря, средняя скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше, чем в группе людей, активно не занимающихся спортом.

В терминах статистических гипотез это утверждение звучит так: гипотеза Н0 о сходстве отклоняется и на уровне значимости 0,1% принимается альтернативная гипотеза Н1 - о различии между экспериментальной и контрольными группами.

Случай связных выборок

В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента.

Вычисление значения tэмп осуществляется по формуле:

Лекция 5. Статистические критерии различий - student2.ru

где

Лекция 5. Статистические критерии различий - student2.ru

где Лекция 5. Статистические критерии различий - student2.ru - разности между соответствующими значениями переменной X ипеременной Y, а Лекция 5. Статистические критерии различий - student2.ru среднее этих разностей.

В свою очередь Sd вычисляется по следующей формуле:

Лекция 5. Статистические критерии различий - student2.ru

Число степеней свободы к определяется по формуле k = n - 1. Рассмотрим пример использования t - критерия Стьюдента для связных, равных по численности выборок.

Задача 9.2.Психолог предположил, что в результате научения время решения эквивалентных задач «игры в 5» (т.е. имеющих один и тот же алгоритм решения) будет значимо уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задач.

Решение. Решение задачи представим в виде таблицы 9.2:

Лекция 5. Статистические критерии различий - student2.ru

Вначале произведем расчет по формуле (9.7):

Лекция 5. Статистические критерии различий - student2.ru

Затем применим формулу (9.8), получим:

Лекция 5. Статистические критерии различий - student2.ru

И, наконец, следует применить формулу (9.6). Получим:

Лекция 5. Статистические критерии различий - student2.ru

Число степеней свободы: k = 8 – 1 = 7 и по таблице 16 Приложения 1 находим tкр :

Лекция 5. Статистические критерии различий - student2.ru

Лекция 5. Статистические критерии различий - student2.ru

Таким образом, на 5% уровне значимости первоначальное предположение подтвердилось, действительно, среднее время решения третьей задачи существенно меньше среднего времени решения первой задачи. В терминах статистических гипотез полученный результат будет звучать так: на 5% уровне гипотеза Н0 отклоняется и принимается гипотеза Н1 — о различиях.

Для применения t-критерия Стъюдента не

Наши рекомендации