Другая интерпретация результата
В педагогических исследованиях, если качественный анализ данных говорит о существенных различиях между группами, допускается считать уровень статистической значимости p ≤ 0,10 достаточным для принятия альтернативной гипотезы. Из таблицы узнаем, что jкр 0,10 = 1,29. Тогда ось значимости будет выглядеть следующим образом:
1,29 1,56 1,64 2,31 2,81 jэмп jкр 0,05 jкр 0,01 jкр 0,001 j* |
jкр 0,10 ≤ jэмп < jкр 0,05. Поэтому принимаем Н1 (p ≤ 0,10).
Вывод. Доля учащихся, решивших задачу, в первой группе больше, чем во второй (p ≤ 0,10).
Уровень статистической значимости можно уточнить, пользуясь соответствующей таблицей. Эмпирическому значению критерия 1,56 соответствует уровень значимости p ≤ 0,06. Поэтому вывод можно сформулировать так:
Вывод. Доля учащихся, решивших задачу, в первой группе больше, чем во второй (p ≤ 0,06).
Интерпретируя по-разному результат, мы можем принять одно из двух взаимоисключающих высказываний («больше — не больше»). Какой именно вывод сделать, определяет сам студент, исходя из анализа всех результатов исследования.
Пример 4. В экспериментальной и контрольной группах проводилось обучение арифметическим действиям с многозначными числами учащихся коррекционных школ VIII вида. В экспериментальной группе — по новой методике, в контрольной — по традиционной. Перед началом обучения было показано, что учащиеся экспериментальной и контрольной группы не отличаются по уровню знаний, необходимых для овладения данной темой. По окончании обучения был проведен контрольный срез, в ходе которого учащимся были предложены задания по изученной теме. Результаты выполнения задания представлены в таблице 7.
Таблица 7. Количество ошибок в контрольных заданиях у учащихся экспериментальной (n1 = 50) и контрольной (n2 = 60) группы.
Количество ошибок | Экспериментальная группа (n1 = 50) | Контрольная группа (n2 = 60) |
S |
Будем считать, что эффект есть, если контрольные задания выполнены без ошибок.
Н0: доля учащихся в экспериментальной группе, выполнивших контрольные задания без ошибок, не превосходит количества таких учащихся в контрольной группе.
Н1: доля учащихся в экспериментальной группе, выполнивших контрольные задания без ошибок, превосходит количество таких учащихся в контрольной группе.
Составим четырехпольную таблицу.
Таблица 8. Процентные доли испытуемых, выполнивших контрольные задания без ошибок и с ошибками.
«Есть эффект» | «Нет эффекта» | S | |
Эксп. группа (n1 = 50) | 10 (20%) | 40 (80%) | |
Контр. группа (n2 = 60) | 6 (10%) | 54 (90%) | |
S |
По таблице величин угла j для разных процентных долей находим:
j1 (20%) = 0,927
j2 (10%) = 0,644
Вычислим эмпирическое значение критерия:
Ö | ||||
jэмп = | (0,927 – 0,644) ∙ | 50 ∙ 60 | = 0,283 ∙ 5,222 = 1,48 | |
50 + 60 | ||||
На «оси значимости» получаем:
1,48 1,64 2,31 2,81 jэмп jкр 0,05 jкр 0,01 jкр 0,001 j* |
В соответствии с правилом отклонения Н0 и принятия Н1, если jэмп < jкр 0,05, то принимаем Н0.
Вывод. Доля учащихся в экспериментальной группе, выполнивших контрольные задания без ошибок, не превосходит количества таких учащихся в контрольной группе.
Точно так же, как в предыдущем примере этот результат можно интерпретировать по-другому, если позволяет качественный анализ экспериментальных данных:
1,29 1,48 1,64 2,31 2,81 jкр 0,10 jэмп jкр 0,05 jкр 0,01 jкр 0,001 j* |
jкр 0,10 ≤ jэмп < jкр 0,05. Поэтому принимаем Н1 (p ≤ 0,10).
Вывод. Доля учащихся в экспериментальной группе, выполнивших контрольные задания без ошибок, превосходит количества таких учащихся в контрольной группе (p ≤ 0,10).
Уточним уровень статистической значимости. Эмпирическому значению критерия 1,48 соответствует уровень значимости p ≤ 0,07. Поэтому вывод можно сформулировать так:
Вывод. Доля учащихся в экспериментальной группе, выполнивших контрольные задания без ошибок, превосходит количества таких учащихся в контрольной группе (p ≤ 0,07).
Если внимательно посмотреть на таблицу 7, видно, что результаты выполнения контрольных заданий сильно различаются. В экспериментальной группе большое количество учащихся выполнило работу без ошибок или с малым количеством ошибок (одной-двумя). В контрольной группе по сравнению с экспериментальной, наоборот, большое количество испытуемых выполнило задания со значительным числом ошибок (от четырех до семи). В коррекционной школе VIII вида основным показателем успешности обучения служит не абсолютное усвоение программного материала, а положительная динамика в усвоении знаний, умений и навыков учащимися. Если исследователь показал, что испытуемые в ходе обучения стали допускать меньше ошибок, то выполнение контрольных заданий с малым количеством ошибок мы тоже можем считать достаточным эффектом. Будем полагать, что эффект есть, если работа выполнена не более, чем с двумя ошибками. Тогда гипотезы можно сформулировать следующим образом:
Н0: доля учащихся в экспериментальной группе, выполнивших контрольные задания не более чем с двумя ошибками, не превосходит количества таких учащихся в контрольной группе.
Н1: доля учащихся в экспериментальной группе, выполнивших контрольные задания не более чем с двумя ошибками, превосходит количество таких учащихся в контрольной группе.
Таблица 9.
Расчет критерия j* при сопоставлении экспериментальной и контрольной групп по количеству учащихся, допустивших не более двух ошибок в контрольных заданиях.
«Есть эффект» | «Нет эффекта» | S | |
Эксп. группа (n1 = 50) | 37 (74%) | 13 (26%) | |
Контр. группа (n2 = 60) | 27 (45%) | 33 (55%) | |
S |
По таблице величин угла j для разных процентных долей находим:
j1 (74%) = 2,071
j2 (45%) = 1,471
Ö | ||||
jэмп = | (2,071 – 1,471) ∙ | 50 ∙ 60 | = 0,600 ∙ 5,222 = 3,13 | |
50 + 60 | ||||
Мы получили очень высокий результат:
1,64 2,31 2,81 3,13 j* jкр 0,05 jкр 0,01 jкр 0,001 jэмп |
В соответствии с правилом отклонения Н0 и принятия Н1, если jэмп ≥ jкр 0,001, то принимаем Н1 (p ≤ 0,001).
Вывод. Доля учащихся в экспериментальной группе, выполнивших контрольные задания не более чем с двумя ошибками, превосходит количество таких учащихся в контрольной группе (p ≤ 0,001).
Можно также сравнить экспериментальную и контрольную группы по доле учащихся, выполнивших задания с большим количеством ошибок (от четырех до семи). Мы получим еще более существенные различия.
Критерий j* удобен скоростью расчетов и возможностью формулировать наличие эффекта по-разному.
Метод ранговой корреляции
Пример 5. Студент исследовал состояние звукопроизношения у детей среднего дошкольного возраста со стертой дизартрией. Проверялся объем нарушенных звуков и объем дефекта звукоразличения, т.е. подсчитывалось количество дефектно произносимых звуков и количество смешиваемых звуков. Результаты выполнения заданий представлены в таблице 10. Существует ли корреляция между объемом нарушения звукопроизношения и объемом дефекта звукоразличения?
Таблица 10.Показатели количества дефектно произносимых и смешиваемых звуков у детей среднего дошкольного возраста со стертой дизартрией (n = 10).
n | Испытуемый | Кол-во дефектно произносимых звуков | Кол-во смешиваемых звуков |
А | |||
Б | |||
В | |||
Г | |||
Д | |||
Е | |||
Ж | |||
З | |||
И | |||
К |
Н0: корреляция между количеством дефектно произносимых звуков и количеством смешиваемых звуков не отличается от нуля.
Н1: корреляция между количеством дефектно произносимых звуков и количеством смешиваемых звуков статистически значимо отличается от нуля.
В таблице 11 проранжированы оба показателя, посчитаны разности (d) между рангами, эти разности возведены в квадрат (d2) и вычислена сумма квадратов разностей рангов (Σ d2).
Таблица 11. Расчет d2 для рангового коэффициента корреляции Спирмена rs при сопоставлении показателей количества дефектно произносимых и смешиваемых звуков у детей среднего дошкольного возраста со стертой дизартрией (n = 10).
n | Переменная А: кол-во дефектно произносимых звуков | Переменная В: кол-во смешиваемых звуков | d = RA – RB | d2 | ||
Инд. значение | RA | Инд. значение | RB | |||
6,5 | – 2,5 | 6,25 | ||||
6,5 | – 3,5 | 12,25 | ||||
6,5 | 1,5 | 2,25 | ||||
– 3 | ||||||
6,5 | 2,5 | 6,25 | ||||
Σ |
Найдем коэффициент ранговой корреляции Спирмена rs по формуле:
rs = 1 – | 6 S d2 |
n (n 2 — 1) |
Для нашего примера:
rs эмп = 1 – | 6 S d2 | = 1 – | 6 ∙ 45 | = 1 – 0,27 = 0,73 |
n (n 2 — 1) | 10 ∙ (102 — 1) |
Табличные критические значения следующие:
0,64 (p ≤ 0,05) | |
rs кр = | |
0,79 (p ≤ 0,01) |
Отметим на «оси значимости» эмпирическое и критические значения:
0,64 0,73 0,79 rs rs кр 0,05 rs эмп rs кр 0,01 |
rs кр 0,05 ≤ rs эмп < rs кр 0,01. Поэтому принимаем Н1 (p ≤ 0,05).
Вывод. Корреляция между количеством дефектно произносимых звуков и количеством смешиваемых звуков статистически значимо отличается от нуля: rs = 0,73 (p ≤ 0,05).
Вероятно, при большем количестве испытуемых в подобном эксперименте можно получить больший коэффициент корреляции.
Схема математической обработки данных эксперимента
На схеме показано, какие исследовательские задачи можно решать и с помощью каких критериев. Для подтверждения эффективности экспериментальной методики достаточно доказать, что на момент начала исследования экспериментальная и контрольная группа не различались по рассматриваемым параметрам, а на момент окончания имелись статистически значимые различия. Доказательство будет более убедительным, если подтвердить наличие положительных сдвигов в экспериментальной группе. И, наконец, если при этом в контрольной группе сдвигов не произошло, то доказана очень высокая эффективность предлагаемой методики.
Для установления связей между различными признаками используем метод ранговой корреляции (на схеме не указан).
Экспериментальная группа | Контрольная группа | ||||||
Уровень исследуемого признака в контрольном эксперименте | Установить различия (критерии Q, U, j*) | ||||||
Установить изменения (критерии G, T, j*) | Уровень исследуемого признака в контрольном эксперименте | ||||||
Установить, имеются изменения или нет (критерии G, T, j*) | |||||||
Уровень исследуемого признака в констатирующем эксперименте | Установить отсутствие различий (критерии Q, U, j*) | Уровень исследуемого признака в констатирующем эксперименте | |||||
Последовательность действий исследователя.
1. Сформулировать задачу исследования в соответствии с целью исследования.
2. Сформулировать содержательную гипотезу.
3. Подобрать выборки испытуемых.
4. Выбрать шкалу измерения.
5. Измерить значения признака.
6. Выбрать статистические критерии в соответствии с задачей исследования и шкалой измерения.
7. Проверить соответствие исследовательской задачи ограничениям использования критерия.
8. Сформулировать статистические гипотезы (в отдельных случаях они формулируются в ходе расчета критерия).
9. Применить статистические критерии, тщательно проверяя правильность вычислений.
10. Если критерий не подтверждает содержательную гипотезу, то:
· применить более мощный критерий;
· увеличить количество испытуемых;
· пересмотреть гипотезу;
· пересмотреть организацию исследования.
Список литературы
1. Ермолаев О.Ю. Математическая статистика для психологов. — 4-е изд., испр. — М., 2006.
2. Плохинский И.А. Алгоритмы биометрии / Под ред. и с предисловием Б.В.Гнеденко. — 2-е изд., перераб. и доп. — М., 1980.
3. Практикум по экспериментальной и прикладной психологии / Под ред. А.А.Крылова. — 2-е изд. — СПб, 1997.
4. Практикум по общей, экспериментальной и прикладной психологии / Под общ. ред. А.А.Крылова, С.А.Маничева. — 2-е изд. — СПб, 2000.
5. Практикум по общей психологии / Под ред. А.И.Щербакова. — 2-е изд. — М., 1990.
6. Сидоренко Е.В. Методы математической обработки в психологии. — СПб, 2006.
7. Суходольский Г.В. Основы математической статистики для психологов. — СПб, 1998.
8. Тарасов С.Г. Основы применения математических методов в психологии. — СПб, 1999.