Пример 1: Сопоставление эмпирического распределения с теоретическим
Ввыборке здоровых лиц мужского пола, студентов технических и военно-технических вузов в возрасте от 19-ти до 22 лет, средний возраст 20 лет, проводился тест Люшера в 8-цветном варианте. Установлено, что желтый цвет предпочитается испытуемыми чаще, чем отвергается (Табл. 4.16). Можно ли утверждать, что распределение желтого цвета по 8-и позициям у здоровых испытуемых отличается от равномерного распределения?
Таблица 4.16
Эмпирические частоты попадания желтого цвета на каждую из 8 позиций (n=102)
Сформулируем гипотезы.
H0: Эмпирическое распределение желтого цвета по восьми позициям не отличается от равномерного распределения.
H1: Эмпирическое распределение желтого цвета по восьми позициям отличается от равномерного распределения.
Теперь приступим к расчетам, постепенно заполняя результатами таблицу расчета критерия λ. Все операции лучше прослеживать по Табл. 4.17, тогда они будут более понятными.
Занесем в таблицу наименования (номера) разрядов и соответствующие им эмпирические частоты (первый столбец Табл. 4.17).Затем рассчитаем эмпирические частости f* по формуле:
f*j = fj /n
где fj - частота попадания желтого цвета на данную позицию;
n - общее количество наблюдений; j - номер позиции по порядку.
Запишем результаты во второй столбец (см. Табл. 4.17). Теперь нам нужно подсчитать накопленные эмпирические частости Σf*. Для этого будем суммировать эмпирические частости f*. Например, для 1-го разряда накопленная эмпирическая частость будет равняться эмпирической частости 1-го разряда, Σf*1=0,235[20].
Для 2-го разряда накопленная эмпирическая частость будет представлять собой сумму эмпирических частостей 1-го и 2-го разрядов:
Σf*1+2=0,235+0,147=0,382
Для 3-го разряда накопленная эмпирическая частость будет представлять собой сумму эмпирических частостей 1-го, 2-го и 3-го разрядов:
Σf*1+2+3=0,235+0,147+0,128=0,510
Мы видим, что можно упростить задачу, суммируя накопленную эмпирическую частость предыдущего разряда эмпирической частостью данного разряда, например, для 4-го разряда:
Σf*1+2+3+4=0,510+0,078=0,588
Запишем результаты этой работы в третий столбец.
Теперь нам необходимо сопоставить накопленные эмпирические частости с накопленными теоретическими частостями. Для 1-го разряда теоретическая частость определяется по формуле:
где k - количество разрядов (в данном случае - позиций цвета).
Для рассматриваемого примера:
f*теор=1/8=0,125
Эта теоретическая частость относится ко всем 8-и разрядам. Действительно, вероятность попадания желтого (или любого другого) цвета на каждую из 8-и позиций при случайном выборе составляет 1/8, т.е. 0,125.
Накопленные теоретические частости для каждого разряда определяем суммированием. Для 1-го разряда накопленная теоретическая частость равна теоретической частости попадания в разряд:
f* т 1=0,125
Для 2-го разряда накопленная теоретическая частость представляет собой сумму теоретических частостей 1-го и 2-го разрядов: f*т 1+2=0,125+0,125=0,250
Для 3-го разряда накопленная теоретическая частость представ
ляет собой сумму накопленной к предыдущему разряду теоретической
частости с теоретической частостью данного разряда:
f*т 1+2+3=0,250+0,125=0,375
Можно определить теоретические накопленные частости и путем!
умножения:
Sf* т j=f* теор j
где f*теор - теоретическая частость; j - порядковый номер разряда.
Занесем рассчитанные накопленные теоретические частости в четвертый столбец таблицы (Табл. 4.17).
Теперь нам осталось вычислить разности между эмпирическими и теоретическими накопленными частостями (столбцы 3-й и 4-й). В пятый столбец записываются абсолютные величины этих разностей, обозначаемые как d.
Определим по столбцу 5, какая из абсолютных величин разности является наибольшей. Она будет называться dmax. В данном случае dmax=0,135.
Теперь нам нужно обратиться к Табл. X Приложения 1 для определения критических значений dmax при n=102.
Таблица 4.17
Расчет критерия при сопоставлении распределения выборов желтого цвета с равномерным распределением (n=102)
Очевидно, что чем больше различаются распределения, тем больше и различия в накопленных частостях. Поэтому нам не составит труда распределить зоны значимости и незначимости по соответствующей оси:
Очевидно, что чем больше различаются распределения, тем больше и различия в накопленных частостях. Поэтому нам не составит труда распределить зоны значимости и незначимости по соответствующей оси:
dэмп=0,135
dэмп=dкр.
Ответ: Н0 отвергается при р=0,05. Распределение желтого цвета по восьми позициям отличается от равномерного распределения. Представим все выполненные действия в виде алгоритма
АЛГОРИТМ 14