Для оценки различий между двумя выборками

Использование критерия χ2 для оценки соответствия экспериментальных распределений теоретическим (нормальному или равномерному) подробно обсуждалось в разделе 6. Тот же критерий может использоваться и для сравнения двух эмпирических распределений на предмет достоверности различий между ними.

В качестве примера рассмотрим следующую задачу:

Условие задачи

В опытах с участием 100 испытуемых (50 мужчин и 50 женщин) регистрировалось время простой сенсомоторной реакции (ВСМР) в ответ на звуковой стимул. Получены следующие результаты (табл. 7.3):

Таблица 7.3

ВСМР в секундах
Классовый Интервал 0,10 ¸ 0,12 0,12 ¸ 0,14 0,14 ¸ 0,16 0,16 ¸ 0,18 0,18 ¸0,20 0,20 ¸0,22 0,22 ¸0,24
Частоты встречаемости ВСМР
Мужчины
Женщины

Задание

Пользуясь критериемχ2 Пирсона, определить, достоверны ли различия распределений ВСМР у мужчин и женщин.

Решение

1. Строим рабочую таблицу для предварительных расчетов (табл. 7.4):

Таблица 7.4

Обозна-чение интер-вала Классовый интервал в секундах Эмпирические частоты (мужчины) Эмпирические частоты (женщины) Сумма эмпирических частот Теоретиче-ские частоты
A В C D E F G 0,10 ÷ 0,12 0,12 ÷ 0,14 0,14 ÷ 0,16 0,16 ÷ 0,18 0,18 ÷ 0,20 0,20 ÷ 0,22 0,22 ÷ 0,24 13,5 6,5 4,5 0,5
Сумма    

Столбец 1 служит исключительно для экономии: в дальнейшем мы не будем указывать границы классовых интервалов – нам будет достаточно того, что распределение включает в себя 7 количественных градаций (классов). В столбцах 2, 3 и 4 отражены данные из условия задачи. Столбец 5 служит для дальнейших вычислений.

Теоретические частоты (столбец 6) в данном случае вычисляются следующим образом:

1) в случае равноценных выборок теоретическая частота в каждом классе вычисляется как среднее арифметическое двух эмпирических частот;

2) если объемы выборок различны, то теоретическая частота вычисляется как сумма эмпирических частот в данной строке, умноженная на сумму в каждом столбце (по вертикали) и отнесенная к общей сумме частот.

Для дальнейших вычислений вносим данные в табл. 7.5:

Таблица 7.5

  Мужчины Женщины
  Интервал fэксп .fтеор. Для оценки различий между двумя выборками - student2.ru fэксп .fтеор. Для оценки различий между двумя выборками - student2.ru
A В C D E F G 13,5 6,5 4,5 0,5 1,00 0,17 0,39 0,35 1,39 1,00 0,50 13,5 6,5 4,5 0,5 1,00 0,17 0,39 0,35 1,39 1,00 0,50

Можно видеть, что это – типичная таблица для вычисления критерия χ2 (см. раздел 6). Значения в столбцах 3 и 6 для мужчин и женщин одинаковы; это естественно, так как теоретические частоты соответствуют средним значениям экспериментальных частот в каждой выборке. Тем не менее χ2 следует рассчитывать, суммируя все значения в столбцах 4 и 6 (т. е. по обеим выборкам).

В итоге получаем χ2 = 9,6. В табл. VI Приложений для уровня значимости 0,95 и ν = N – 1 = 6 находим значение χ2кр., равное12,6.

Вывод

Различия между распределениями не являются статистически достоверными.

Для решения задачи можно использовать критерий Колмогорова в несколько иной модификации, нежели при сравнении экспериментального распределения с теоретическим. Для этого оформляем рабочую таблицу следующего вида (табл. 7.6):

Таблица 7.6

  Экспериментальные частоты Накопленные экспериментальные частоты Относительные накопленные частоты   d
  Интервал fм fж Fм Fж F*м F*ж
A В C D E F G 0,04 0,34 0,86 0,96 1,00 1,00 1,00 0,24 0,64 0,80 0,94 0,98 1,00 0,04 0,10 0,22 0,16 0,06 0,02

Рекомендуется следующий порядок вычислений:

1. В столбце 1 – условные обозначения временных интервалов; в столбцах 2 и 3 – экспериментальные частоты мужчин (2) и женщин (3).

2. В столбцах 4 и 5 – накопленные частоты для мужчин (4) и женщин (5). Напомним, что накопленные частоты вычисляются путем простого суммирования частот от первого до последнего класса.

3. В столбцах 6 и 7 – относительные накопленные частоты (F* = F/n). Другими словами, каждая накопленная частота в столбцах 4 и 5 делится на 50.

4. Вычисляем критерий λ по формуле Колмогорова в следующей модификации:

Для оценки различий между двумя выборками - student2.ru (7.9)

В нашем случае:

Для оценки различий между двумя выборками - student2.ru

Вывод

Распределения отличаются друг от друга с вероятностью 0,822 (см. Приложения, табл. VII). Другими словами, соответствие между распределениями можно констатировать лишь с вероятностью 0,178.

Чем можно объяснить причины несоответствия результатов, полученных с помощью критериев χ2 и λ? По-видимому, критерий Колмогорова, основанный на накоплении эмпирических частот, является более чувствительным к различиям и позволяет зафиксировать те тонкие нюансы, которые недоступны критерию Пирсона. Таким образом, в целом, можно усомниться в том, что различий вообще не существует. Кстати говоря, более мощные критерии (Стьюдента и Фишера), которые также можно применить к решению данной задачи, дают достоверные различия между двумя выборками на уровне значимости 0,95.

В заключение следует констатировать, что оценка различий между двумя распределениями по вышеупомянутым критериям может быть использована лишь в случае отсутствия достаточной информации о каждом конкретном значении переменной в выборках.

Задачи по теме

Задача 7. 1

40 студентов (20 юношей и 20 девушек) обследованы на уровень нейротизма – эмоциональной стабильности по тесту Айзенка. Полу­чены следующие результаты:

Юноши
Девушки

Задание

Определить достоверность различий по уровню нейротизма у юношей и девушек, выбрав один или несколько критериев, адекватных условию задачи.

Задача 7. 2

Условие задачи

В психофизиологическом эксперименте 29 юношей и 27 девушек были протестированы методике РДО (реакция на движущийся объект). В числе показателей использовался следующий критерий: величина средней ошибки S остановки движущейся точки на линии. Получены следующие значения S (в миллисекундах) для двух групп испытуемых:

Юноши Девушки
№№ S №№ S №№ S №№ S №№ S №№ S

Задание

Определить достоверность различий между показателями РДО для юношей и девушек, выбрав адекватный критерий обработки результатов.

Задача 7.3

Условие задачи

Первоклассники одной из средних школ (12 мальчиков и 10 девочек) были протестированы по детскому тесту Д. Векслера на уровень интеллекта. Результаты тестирования (индивидуальные значения IQ) представлены в таблице.

Испытуемый пол IQ Испытуемый Пол IQ
м м м м м м м м м м м м д д д д д д д д д д

Задание. Проанализировать полученные результаты на предмет половых различий в уровне интеллекта детей.

Задача 7.4

Условие задачи

С помощью цветового теста отношений (ЦТО) были исследованы семейные отношения у мужчин-невротиков (38 человек). Оказалось, что 74% мужчин ассоциируют свою жену с одним из светлых цветов и лишь 26% - с темным. Себя ассоциируют со светлыми цветами лишь 31% мужчин, остальные 68% - с темными.

Вопрос

Можно ли на основании приведенных выше данных утверждать, что в восприятии семьи мужчинами-невротиками наблюдается выраженная асимметрия: качества активного, доминантного, «светлого» начала больные приписывают жене, а себе оставляют пассивную, страдательную роль?

Задача 7.5

Американский исследователь Стеннет изучал связь между полом и количеством пропусков детского сада. Он получил следующие данные: более 20 дней в году пропустили 29% мальчиков и 27% девочек. Всего в его исследовании приняли участие 873 мальчика и 837 девочек.

Вопрос

Можно ли считать, что мальчики пропускают детский сад чаще девочек?

З а д а ч а 7. 6

В двух студенческих выборках (n1 = 27, n2 = 23) исследовался коэффициент интеллекта (IQ). Получены следующие результаты:

Группа1 Группа 2
№№ IQ №№ IQ №№ IQ №№ IQ
   

Задание

Определить, достоверны ли различия распределений IQ в двух студенческих группах.

Задача 7.7

Условие задачи. С помощью цветового теста отношений протестированы 38 человек с депрессивными симптомами и 50 человек без каких-либо выраженных психиатрических симптомов. Оказалось, что свое настроение ассоциируют с яркими цветами (красный, желтый, зеленый) 40% здоровых и 5% депрессивных испытуемых. Свое прошлое ассоциируют с аналогичными цветами 14% больных против 22% здоровых.

Задание

Определить достоверность различий между данными группами испытуемых.

РАЗДЕЛ 8. МЕРЫ СВЯЗИ

Постановка проблемы

Многие психологические черты, свойства, признаки не являются независимыми, а определенным образом взаимосвязаны между собой. Поэтому психологу часто приходится иметь дело с выявлением наличия и характера связи между этими признаками, свойствами, чертами. Это позволяет в известной степени минимизировать число изучаемых признаков, объединяя их в более крупные конгломераты, особенно в тех случаях, когда число таких признаков достаточно велико.

В математическом смысле задача состоит в нахождении связи между двумя рядами переменных (xi и yi), измеренных на одной и той же выборке испытуемых. О наличии связи (корреляции) между этими переменными можно говорить в тех случаях, когда изменение величины х ведет к закономерному изменению величины у,и если характер изменений является предсказуемым.

Представление данных

Данные о связи двух переменных могут быть представлены либо графически (в виде диаграмм рассеивания), либо путем вычисления коэффициентов корреляции по соответствующим формулам.

В графическом изображении каждый испытуемый может быть представлен точкой в координатах у = f (х), причем величины хi и уiсоответствуют значениям двух исследуемых признаков. Выборка испытуемых в этих координатах представляет собой «облако рассеивания» точек, которое может иметь различную форму ( рис. 8.1).

Для оценки различий между двумя выборками - student2.ru  

Рис. 8.1. Графическое представление связи между переменными (облако рассеивания точек имеет различную форму в зависимости от характера связи), объяснение в тексте

При наличии прямой (положительной) связи между переменными облако рассеивания имеет более или менее уплощенную эллиптическую форму, длинная ось которого направлена вправо и вверх. Другими словами, при возрастании значения одной переменной имеется тенденция к увеличению другой переменной.

В случае отрицательной связи между переменными длинная ось облака рассеивания направлена вправо вниз, т. е., увеличение значений одной переменной соответствует закономерному снижению значений другой.

Наконец, если облако рассеивания имеет округлую форму, то можно предположить, что корреляция между переменными отсутствует или, по крайней мере, она весьма незначительна.

В психологии используется несколько различных мер связи (коэффициентов корреляции), выбор которых определяется в первую очередь типом шкалы, который формирует исследуемая переменная величина. Чаще всего коэффициенты корреляции представляют собой величины, стандартизованные таким образом, что они могут принимать значения от –1 (строгая обратная связь) до +1 (строгая прямая связь). Вычисление коэффициента корреляции предполагает также определение его статистической значимости (достоверности) по соответствующим формулам или таблицам. Достоверность коэффициента корреляции может быть определена для определенного уровня значимости (0,95, 0,99 и т. д.).

Наши рекомендации