Лекция 5. Статистические критерии различий
Лекция 5. Статистические критерии различий
Параметрические и непараметрические критерии. Рекомендации к выбору критерия различия
Все критерии различий условно подразделены на две группы: параметрические и непараметрические критерии.
Критерий различия называют параметрическим, если он основан на конкретном типе распределения генеральной совокупности (как правило, нормальном) или использует параметры этой совокупности (средние, дисперсии и т.д.).
Критерий различия называют непараметрическим, если он не базируется на предположении о типе распределения генеральной совокупности и не использует параметры этой совокупности. Поэтому для непараметрических критериев предлагается также использовать такой термин как «критерий, свободный от распределения».
При нормальном распределении генеральной совокупности параметрические критерии обладают большей мощностью по сравнению с непараметрическими. Иными словами, они способны с большей достоверностью отвергать нулевую гипотезу, если последняя неверна. По этой причине в тех случаях, когда выборки взяты из нормально распределенных генеральных совокупностей, следует отдавать предпочтение параметрическим критериям.
Однако, как показывает практика, подавляющее большинство данных, получаемых в психологических экспериментах, не распределены нормально, поэтому применение параметрических критериев при анализе результатов психологических исследований может привести к ошибкам в статистических выводах. В таких случаях непараметрические критерии оказываются более мощными, т.е. способными с большей достоверностью отвергать нулевую гипотезу.
Итак, при оценке различий в распределениях, далеких от нормального, непараметрические критерии могут выявить значимые различия, в то время как параметрические критерии таких различий не обнаружат.
Важно отметить, что,
во-первых, непараметрические критерии выявляют значимые различия и в том случае, если распределение близко к нормальному;
во-вторых, при вычислениях вручную непараметрические критерии являются значительно менее трудоемкими, чем параметрические.
При подготовке экспериментального исследования психолог должен заранее запланировать характеристики сопоставляемых выборок (прежде всего связность–несвязность и однородность), их величину (объем), тип измерительной шкалы и вид используемого критерия различий. Последовательно это можно представить в виде следующих этапов:
1. Прежде всего, следует определить, является ли выборка связной (зависимой) или несвязной (независимой).
2. Следует определить однородность–неоднородность выборки.
3. Затем следует оценить объем выборки и, зная ограничения каждого критерия по объему, выбрать соответствующий критерий.
4. При этом целесообразнее всего начинать работу с выбора наименее трудоемкого критерия.
5. Если используемый критерий не выявил различия – следует применить более мощный, но одновременно и более трудоемкий критерий.
6. Если в распоряжении психолога имеется несколько критериев, то следует выбирать те из них, которые наиболее полно используют информацию, содержащуюся в экспериментальных данных.
7. При малом объеме выборки следует увеличивать величину уровня значимости (не менее 1%), так как небольшая выборка и низкий уровень значимости приводят к увеличению вероятности принятия ошибочных решений.
В психологических исследованиях для доказательства эффективности внедряемых программ, тренингов, упражнений и т.д., помимо отслеживания на определенных этапах качественных изменений, используется и математическая статистика.
С помощью математических методов сопоставляются результаты «до» и «после» воздействия, выявляется динамика изменения показателей под влиянием экспериментальных воздействий, сравниваются контрольная и экспериментальная группы, оценивается характер изменения какого-либо психологического показателя в нескольких группах и т.д.
Целью любого педагогического эксперимента является эмпирическое подтверждение или опровержение гипотезы исследования и/или справедливости теоретических результатов, то есть обоснование того, что предлагаемое педагогическое воздействие (например, новые содержание, формы, методы, средства обучения и т.д.) более эффективно (или, возможно, наоборот – менее эффективно).
Для этого, как минимум, необходимо показать, что, будучи примененным к тому же объекту (например – к группе учащихся), оно дает другие результаты, чем применение традиционных педагогических воздействий.
Для этого выделяется экспериментальная группа, которая сравнивается с контрольной группой.
Различие эффектов педагогических воздействий будет обосновано, если две эти группы, первоначально совпадающие по своим характеристикам, различаются после реализации педагогических воздействий.
Следовательно, требуется провести два сравнения и показать, что при первом сравнении (до начала педагогического эксперимента) характеристики экспериментальной и контрольной группы совпадают, а при втором (после окончания эксперимента) – различаются.
Так как объектом педагогического эксперимента, как правило, являются люди (учащиеся, учителя, сотрудники и руководители органов управления образованием и т.д.), а каждый человек индивидуален, то говорить о совпадении или различии характеристик экспериментальной и контрольной групп можно лишь в чисто формальном, статистическом смысле. Для того, чтобы выяснить, являются ли совпадения или различия случайными, используются статистические методы, которые позволяют на основании данных, полученных в результате эксперимента, принять обоснованное решение о совпадениях или различиях.
Общий алгоритм использования статистических критериев прост: до начала и после окончания эксперимента на основании информации о результатах наблюдений (характеристиках членов экспериментальной и контрольной группы) вычисляется эмпирическое значение критерия (алгоритм выбора статистического критерия и формулы для вычислений приведены ниже). Это число сравнивается с известным (табличным) числом – критическим значением критерия (критические значения для всех рекомендуемых нами критериев приведены ниже). Если эмпирическое значение критерия попадает в зону незначимости, , то можно утверждать, что "характеристики экспериментальной и контрольной групп совпадают с уровнем значимости 0,05 по статистическому критерию …(далее следует название использованного критерия: Крамера-Уэлча, Вилкоксона-Манна-Уитни, хи-квадрат, Фишера)".
В противном случае (если эмпирическое значение критерия оказывается вне зоны незначимости), можно утверждать, что "достоверность различий характеристик экспериментальной и контрольной групп по статистическому критерию … равна 95%".__
Следовательно, если характеристики экспериментальной и контрольной групп до начала эксперимента совпадают с уровнем значимости 0,05, и, одновременно с этим, достоверность различий характеристик экспериментальной и контрольной групп после эксперимента равна 95%, то можно сделать вывод, что "применение предлагаемого педагогического воздействия(например, новой методики обучения) приводит к статистически значимым (на уровне 95% по критерию …) отличиям результатов".
Важно!!! Если до начала эксперимента выявлено статистически значимое различие характеристик экспериментальной и контрольной групп по интересующему исследователя критерию (например, по успеваемости), то проводить эксперимент не имеет смысла, так как никакие результаты сравнения характеристик этих групп после окончания эксперимента, не позволят выявить вклада педагогического воздействия, сравниваемого с традиционным.
Назначение критерия
Критерий используется для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых.
Описание критерия
Это очень простой непараметрический критерий, который позволяет быстро оценить различия между двумя выборками по какому-либо признаку. Но если критерий не выявляет достоверных различий, это еще не означает, что их действительно нет.
В этом случае стоит применить критерий Фишера. Если же - критерий выявляет достоверные различия между выборками с уровнем значимости ,можно ограничиться только им и избежать трудностей применения других критериев.
Критерий применяется в тех случаях, когда данные представлены, по крайней мере, в порядковой шкале. Признак должен варьировать в каком-то диапазоне, иначе сопоставления с помощью -критерия просто невозможны.
Применение критерия начинают с того, что упорядочивают значения признака в обеих выборках по нарастанию (или убыванию) признака. Лучше всего, если данные каждого испытуемого представлены на отдельной карточке. Тогда ничего не стоит упорядочить два ряда значений по интересующему нас признаку, раскладывая карточки на столе. При этом сразу видно, совпадают ли диапазоны значений, и если нет, то насколько один ряд значений «выше» , а второй – «ниже» . Для того, чтобы не запутаться, в этом и во многих других критериях рекомендуется первым рядом (выборкой, группой) считать тот ряд, где значения выше, а вторым рядом – тот, где значения ниже.
Гипотезы
: Уровень признака в выборке 1 не превышает уровня признака в выборке 2.
: Уровень признака в выборке 1 превышает уровень признака в выборке 2.
Для использования критерия необходимо соблюдать следующие условия:
1. Измерение может быть проведено в шкале порядка, интервалов и отношений.
2. Выборки должны быть независимыми.
3. В каждой из выборок должно быть не меньше 11 испытуемых.
4. Приведенная в настоящем пособии таблица ограничивает верхний предел выборки 26 испытуемыми.
5. При числе наблюдений можно пользоваться следующими величинами :
6. Принципиальным условием, дающим возможность применять критерий, является наличие «хвостов» в сравниваемых рядах (см. задачу). В случае расположения выборок следующим образом:
х х х х х х х х х х х х х х
у у у у у у у
критерий оказывается неприменим. Следует использовать критерий U.
Работа с критерием Розенбаума предполагает подсчет так называемых «хвостов». Потому этот критерий имеет также название — «критерий хвостов». Что же такое «хвост»?
В случае, если в сравниваемых рядах будут равные элементы, их следует размещать точно друг под другом. В этом случае два сравниваемых ряда можно расположить друг под другом следующим способом:
|t t t t| t t t t t t
z z z z |z z z z|
Символы и обозначают соответственно правый и левый «хвосты», причем, , а .
подсчитывается очень просто - это сумма величин и , т.е.
После подсчета сумм "хвостов" следует обратиться к таблице 8 Приложения в соответствии с количеством испытуемых в сравниваемых выборках. Когда сумма достаточно велика, можно считать различия сравниваемых выборок значимыми.
Алгоритм
подсчета критерия Розенбаума
1. Проверить, выполняются ли ограничения: .
2. Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше (правее), а выборкой 2 – ту, где значения предположительно ниже (левее).
3. Определить самое высокое (максимальное) значение в выборке 2.
4. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как .
5. Определить самое низкое (минимальное) значение в выборке 1.
6. Подсчитать количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как .
7. Посчитать по формуле:
8. По таблице 8 Приложения определить для данных и . Если , то - отвергается.
9. При сопоставить полученное с Если превышает или, по крайней мере, равняется , то - отвергается.
2.2. Критерий U Вилкоксона-Манна-Уитни
Назначение критерия
Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различие между малыми выборками, когда или и является более мощным, чем критерий Розенбаума.
Описание критерия
Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам.
Этот способ определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (1-м рядом, выборкой, группой называется ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом – тот, где они предположительно ниже).
Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.
Эмпирическое значение критерия отражает то, насколько велика зона совпадения между рядами. Поэтому, чем меньше , тем более вероятно, что различия достоверны.
Гипотезы
: Уровень признака в группе 2 не ниже уровня признака в группе 1.
: Уровень признака в группе 2 ниже уровня признака в группе 1
Для применения критерия U необходимо соблюдать следующие условия:
1. Измерение должно быть проведено в шкале интервалов и отношений.
2. Выборки должны быть несвязанными.
3. Нижняя граница применимости критерия или , а .
4. Верхняя граница применимости критерия: .
Замечание. Критерий U применяют и для связных выборок, рассматривая их при этом как независимые. Последнее возможно, если связи внутри генеральной совокупности оказываются слабыми, а различия между двумя связными выборкам – сильными. В этом случае возможно получение значимых различий по критерию U, в то время как критерии, специально предназначенные для связанных выборок, могут и не обнаружить значимых различий.
Рассмотрим на примере применение данного критерия.
Задача 1.Две неравные по численности группы испытуемых решали техническую задачу. Показателем успешности служило время решения. Испытуемые меньшей по численности группы получали дополнительную мотивацию в виде денежного вознаграждения. Психолога интересует вопрос – влияет ли вознаграждение на успешность решения задачи?
Психологом были получены следующие результаты времени решения технической задачи в секундах: в первой группе – с дополнительной мотивацией – 39, 38, 44, 6, 25, 25, 30, 43; во второй группе – без дополнительной мотивации – 46, 8, 50, 45, 32, 41, 41, 31, 55. Число испытуемых в первой группе обозначается, как и равно 8, во – второй, как и равно 9.
Решение. Для ответа на вопрос задачи применим критерий U - Вилкоксона-Манна-Уитни. Существует два способа подсчета по критерию U. Последовательно рассмотрим оба способа.
Алгоритм
Назначение критерия
Критерий хи-квадрат (другая форма записи – греческая буква «хи») один из наиболее часто использующихся в психологических исследованиях, поскольку он позволяет решать большое число разных задач, и, кроме того, исходные данные для него могут быть получены в любой шкале, начиная со шкалы наименований.
Критерий хи-квадрат используется в двух вариантах:
· как расчет согласия эмпирического распределения и предполагаемого теоретического; в этом случае проверяется гипотеза об отсутствии различий между теоретическим и эмпирическим распределениями;
· как расчет однородности двух независимых экспериментальных выборок; в этом случае проверяется гипотеза об отсутствии различий между двумя (тремя или более) эмпирическими (экспериментальными) распределениями одного и того же признака.
Описание критерия
Критерий отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.
Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований.
При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теоретическими частотами.
При сопоставлении двух эмпирических распределений мы определяем степень расхождения между эмпирическими частотами и теоретическими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений.
Критерий построен так, что при полном совпадении экспериментального и теоретического (или двух экспериментальных) распределений величина , и чем больше расхождение между сопоставляемыми распределениями, тем больше величина эмпирического значения хи-квадрат.
Гипотезы
Возможны несколько вариантов гипотез, в зависимости от задач, которые мы перед собой ставим.
Первый вариант:
: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения.
: Полученное эмпирическое распределение признака отличается от теоретического распределения.
Второй вариант:
: Эмпирическое распределение 1 не отличается от эмпирического распределения 2.
: Эмпирическое распределение 1 отличается от эмпирического распределения 2.
Третий вариант:
: Эмпирические распределения 1, 2. 3. … не различаются между собой.
: Эмпирические распределения 1, 2. 3. … различаются между собой.
Для применения критерия необходимо соблюдать следующие условия:
1. Измерение может быть проведено в любой шкале.
2. Выборки должны быть случайными и независимыми.
3. Желательно, чтобы объем выборки был ≥ 20. С увеличением объема выборки точность критерия повышается.
4. Теоретическая частота для каждого выборочного интервала не должна быть меньше 5.
5. Сумма наблюдений по всем интервалам должна быть равна общему количеству наблюдений.
6. Таблица критических значений критерия рассчитана для числа степеней свободы , которое каждый раз рассчитывается по определенным правилам.
В общем случае число степеней свободы определяется по формуле: , где с - число альтернатив (признаков, значений, элементов) в сравниваемых переменных.
Для таблиц, число степеней свободы определяется по формуле: , где k - число столбцов, с - число строк.
Назначение критерия
Критерий предназначен для сопоставления двух распределений:
а) эмпирического с теоретическим, например, равномерным или нормальным;
б) одного эмпирического распределения с другим эмпирическим распределением.
Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.
Описание критерия
Если в методе мы сопоставляли частоты двух распределений отдельно по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т.д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты.
Если различия между двумя распределениями существенны, то в какой–то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия включается эта разность. Чем больше эмпирическое значение , тем более существенны различия.
Гипотезы
Различия между распределениями недостоверны (судя по точке максимального накопленного расхождения между ними).
: Различия между распределениями достоверны (судя по точке максимального накопленного расхождения между ними).
Для применения критерия Колмогорова–Смирнова необходимо соблюдать следующие условия:
1. Измерение может быть проведено шкале интервалов и отношений.
2. Выборки должны быть случайными и независимыми.
3. Желательно, чтобы суммарный объем двух выборок ≥ 50. С увеличением объема выборки точность критерия повышается.
4. Эмпирические данные должны допускать возможность упорядочения по возрастанию или убыванию какого-либо признака и обязательно отражать какое-то его однонаправленное изменение. В том случае, если трудно соблюсти принцип упорядоченности признака, лучше использовать критерий хи-квадрат.
Этот критерий используется для решения тех же задач, что и критерий xи-квадрат. Иначе говоря, с его помощью можно сранивать эмпирическое распределение с теоретическим или два эмпирических распределения друг с другом. Однако если при применении хи-квадрат мы сопоставляем частоты двух распределений, то в данном критерии сравниваются накопленные (кумулятивные) частоты по каждому разряду (альтернативе). При этом если разность накопленных частот в двух распределениях оказывается большой, то различия между двумя распределениями являются существенными.
Задача 8.12.Предположим, что в эксперименте психологу необходимо использовать шестигранный игральный кубик с цифрами на гранях от 1 до 6. Для чистоты эксперимента необходимо получить «идеальный» кубик, т.е. такой, чтобы при достаточно большом числе подбрасываний, каждая его грань выпадала бы примерно равное число раз. Задача состоит в выяснении того, будет ли данный кубик близок к идеальному?
Решение. Подбросим кубик 120 раз и сравним полученное эмпирическое распределение с теоретическим. Поскольку теоретическое распределение является равновероятным, то соответствующие теоретические частоты равны 20. Распределение эмпирических и теоретических частот представим совместно в таблице 8.15:
Для подсчета по критерию Колмогорова–Смирнова необходимо провести ряд преобразований с данными таблицы 8.15. Представим эти преобразования в таблице 8.16 и объясним их получение:
Символом FE в таблице 8.16 будем обозначать накопленные теоретические частоты. В таблице они получаются следующим образом: к первой теоретической частоте 20, добавляется вторая частота, также равная 20, получается число 20 + 20 = 40. Число 40 ставится на место второй частоты. Затем к числу 40 прибавляется следующая теоретическая частота, полученная величина 60 — ставится на место третьей теоретической частоты и так далее.
Символом FB в таблице 8.16 обозначаются накопленные эмпирические частоты. Для их подсчета необходимо расположить эмпирические частоты по возрастанию: 15, 18, 18, 21, 23, 25 и затем по порядку сложить. Так, вначале стоит первая частота равная 15, к ней прибавляется вторая по величине частота и полученная сумма 15 + 18 = 33 ставится на место второй частоты, затем к 33 добавляется 18 (33 + 18 = 51), полученное число 51 ставится на место третьей частоты и т.д.
Символом |FE - FB| в таблице 8.16 обозначаются абсолютные величины разности между теоретической и эмпирической частотой по каждому столбцу отдельно.
Эмпирическую величину этого критерия, которая обозначается как Dэмп получают используя формулу (8.13):
Для её получения среди чисел |FE - FB| находят максимальное число (в нашем случае оно равно 9) и делят его на объем выборки п. В нашем случае п = 120, поэтому
Для этого критерия таблица с критическими значениями дана в Приложении 1 под № 13. Из таблицы 13 Приложения 1 следует, однако, что в том случае, если число элементов выборке больше 100, то величины критических значений вычисляются по формуле (8.14):
Иными словами, вместо привычных табличных значений вычисляются величины Dкр подстановкой величины объема выборки вместо символа п.
В нашем случае п = 120, поэтому Dкр для0,05 равно
и Dкp для 0,01 равно , или в привычной форме записи:
В нашем случае Dэмп оказалось равным 0,075, что гораздо меньше 0,124, иначе говоря, эмпирическое значение критерия Колмогорова-Смирнова попало в зону незначимости. Таким образом, гипотеза Н1 отклоняется и принимается гипотеза о том, что теоретическое и эмпирическое распределения не отличаются между собой. Следовательно, можно с уверенностью утверждать, что наш игральный кубик «безупречен».
2.5. Критерий - угловое преобразование Фишера
Назначение критерия
Критерий Фишера предназначен для сопоставления двух рядов выборочных значений по частоте встречаемости какого-либо признака. Этот критерий можно применять для оценки различий в любых двух выборках зависимых или независимых. С его помощью можно сравнивать показатели одной и той же выборки, измеренные в разных условиях.
Описание критерия
Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий нас эффект.
Суть углового преобразования Фишера состоит в переводе процентных долей в величины центрального угла, который измеряется в радианах. Большей процентной доле будет соответствовать больший угол , а меньшей доле – меньший угол,но соотношения здесь не линейные: , где - процентная доля, выраженная в долях единицы.
При увеличении расхождения между углами , и увеличения численности выборок значение критерия возрастет. Чем больше величина , тем более вероятно, что различия достоверны.
Гипотезы
: Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 не больше, чем в выборке 2.
: Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 больше, чем в выборке 2.
Для применения критерия Фишера необходимо соблюдать следующие условия:
1. Измерение может быть проведено в любой шкале.
2. Характеристики выборок могут быть любыми.
3. Нижняя граница — в одной из выборок может быть только 2 наблюдения, при этом во второй должно быть не менее 30 наблюдений. Верхняя граница не определена.
4. Нижние границы двух выборок должны содержать не меньше 5 элементов (наблюдений) в каждой.
Случай несвязных выборок
В общем случае формула для расчета по t-критерию Стьюдента такова:
где
Рассмотрим сначала равночисленные выборки. В этом случае п1= п2 =п, тогда выражение (9.2) будет вычисляться следующим образом:
В случае не равночисленных выборок п1 ≠ п2, выражение (9.2) будет вычисляться следующим образом:
В обоих случаях подсчет числа степеней свободы осуществляется по формуле:
где п1и п2 соответственно величины первой и второй выборки.
Понятно, что при численном равенстве выборок k= 2 · п – 2.
Рассмотрим пример использования t-критерия Стьюдента для несвязных и неравных по численности выборок.
Задача 9.1.Психолог измерял время сложной сенсомоторной реакции выбора (в мс) в контрольной и экспериментальной группах. В экспериментальную группу (X) входили 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающиеся спортом. Психолог проверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем эта же величина у людей, не занимающихся спортом.
Решение. Результаты эксперимента представим в виде таблицы 9.1, в которой произведем ряд необходимых расчетов:
Средние арифметические составляют в экспериментальной
группе , в контрольной группе .
Разница по абсолютной величине между средними
.
Подсчет выражения 9.4 дает:
Тогда значение tэмп, вычисляемое по формуле (9.1), таково:
Число степеней свободы k = 9 + 8-2= 15. По таблице 16 Приложения 1 для данного числа степеней свободы находим:
Таким образом, обнаруженные психологом различия между экспериментальной и контрольной группами значимы более чем на 0,1% уровне, или, иначе говоря, средняя скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше, чем в группе людей, активно не занимающихся спортом.
В терминах статистических гипотез это утверждение звучит так: гипотеза Н0 о сходстве отклоняется и на уровне значимости 0,1% принимается альтернативная гипотеза Н1 - о различии между экспериментальной и контрольными группами.
Случай связных выборок
В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента.
Вычисление значения tэмп осуществляется по формуле:
где
где - разности между соответствующими значениями переменной X ипеременной Y, а среднее этих разностей.
В свою очередь Sd вычисляется по следующей формуле:
Число степеней свободы к определяется по формуле k = n - 1. Рассмотрим пример использования t - критерия Стьюдента для связных, равных по численности выборок.
Задача 9.2.Психолог предположил, что в результате научения время решения эквивалентных задач «игры в 5» (т.е. имеющих один и тот же алгоритм решения) будет значимо уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задач.
Решение. Решение задачи представим в виде таблицы 9.2:
Вначале произведем расчет по формуле (9.7):
Затем применим формулу (9.8), получим:
И, наконец, следует применить формулу (9.6). Получим:
Число степеней свободы: k = 8 – 1 = 7 и по таблице 16 Приложения 1 находим tкр :
Таким образом, на 5% уровне значимости первоначальное предположение подтвердилось, действительно, среднее время решения третьей задачи существенно меньше среднего времени решения первой задачи. В терминах статистических гипотез полученный результат будет звучать так: на 5% уровне гипотеза Н0 отклоняется и принимается гипотеза Н1 — о различиях.
Для применения t-критерия Стъюдента не