Критерии оценки достоверности сдвига в значениях
Исследуемого признака
1. G – критерий знаков.
2. Т – критерий Вилкоксона.
3. Критерий тенденций L Пейджа
4. X² – критерий Фридмена
5. Применение непараметрических критериев: классификация сдвигов и критериев оценки их статистической достоверности.
1. G – критерий знаков
Критерий знаков предназначен для установления общего направления сдвига исследуемого признака. Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму.
Критерий применим как к тем изменениям, которые могут быть определены только качественно (например, изменение отношения к чему-либо), так и к тем, которые могут быть измерены количественно (например, сокращение времени работы над заданием после экспериментального воздействия).
Под сдвигами понимается разница между значением n-ного наблюдения в первом и втором измерении. Иными словами, сдвиг – это разница между тем результатом, который показал n-ный испытуемый из выборки до и после экспериментального воздействия. В ходе эксперимента может стать видно, что, к примеру, у большинства испытуемых сдвиг произошел в положительную сторону (усиление признака; в ту сторону, которую предполагал исследователь и т.п.). Производится подсчет положительных, отрицательных и нулевых сдвигов (изменений не зафиксировано), затем последние исключаются из рассмотрения, что уменьшает фактический объем выборки. Согласно табличным данным, производится сопоставление и определение достоверности различий.
Преобладающие сдвиги принято называть «типичными», сдвиги в противоположную сторону – «нетипичными».
Гипотезы
Но. Преобладание направления сдвига является случайным.
Н 1.Преобладание направления сдвига не является случайным.
Ограничения критерия.
Объем выборки может находиться в диапазоне от 5 до 300 элементов.
Алгоритм подсчета G – критерия знаков
1. Подсчитать количество нулевых сдвигов и исключить их из рассмотрения. (При этом n уменьшится, и не должно стать меньше 5).
2. Определить преобладающее направление изменений. Считать сдвиги в преобладающем направлении «типичными».
3. Определить количество «нетипичных» сдвигов, считать это число эмпирическим значением G.
4. Определить из таблиц критическое значение для данного объема выборки и сопоставить с полученным эмпирическим значением G. В случае если эмпирическое число меньше или равно критическому, сдвиг в типичную сторону может считаться достоверным.
2. Т – критерий Вилкоксона
Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть, способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом.
Критерий применим в тех случаях, когда признаки измерены, по крайней мере, в порядковой шкале. Целесообразно применять данный критерий, когда величина самих сдвигов варьирует в некотором диапазоне (10-15% от их величины). Это объясняется тем, что разброс значений сдвигов должен быть таким, чтобы появлялась возможность их ранжирования. В случае если сдвиги незначительно отличаются между собой, и принимают какие-то конечные значения, например. +1, -1 и 0, формальных препятствий к применению критерия нет, но, ввиду большого числа одинаковых рангов, ранжирование утрачивает смысл, и те же результаты проще было бы получить с помощью критерия знаков.
Суть метода состоит в том, что мы сопоставляем абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.
Сдвиг в более часто встречающемся направлении принято считать «типичным», и наоборот.
Гипотезы
Но. Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.
Н1. Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.
Ограничения критерия
Объем выборки – от 5 до 50 элементов.
Нулевые сдвиги исключаются из рассмотрения. (Это требование можно обойти, переформулировав вид гипотезы. Например: сдвиг в сторону увеличения значений превышает сдвиг в сторону их уменьшения и тенденцию к сохранению на прежнем уровне.)
Алгоритм вычисления Т – критерия Вилкоксона
1. Составить список испытуемых в любом порядке, например, алфавитном.
2. Вычислить разность между индивидуальными значениями во втором и первом замерах. Определить, что будет считаться типичным сдвигом.
3. Согласно алгоритму ранжирования, проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг, и проверить совпадение полученной суммы рангов с расчетной.
4. Отметить каким-либо способом ранги, соответствующие сдвигам в нетипичном направлении. Подсчитать их сумму Т.
5. Определить критические значения Т для данного объема выборки. Если Т-эмп. меньше или равен Т-кр. – сдвиг в «типичную» сторону достоверно преобладает.
3. L – критерий тенденций Пейджа
Критерий L Пейджа применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых.
Критерий позволяет выявить тенденции в измерении величин признака при переходе от условия к условию. Его можно рассматривать как продолжение теста Фридмена, поскольку он не только констатирует различия, но и указывает на направление изменений.
Критерий позволяет проверить наши предположения об определенной возрастной или ситуативно обусловленной динамике тех или иных признаков. Он позволяет объединить несколько произведенных замеров единой гипотезой о тенденции изменения значений признака при переходе от замера к замеру. Если бы не его ограничения, критерий был бы незаменим в "продольных" или лонгитюдных исследованиях.
К сожалению, имеющиеся таблицы критических значений рассчитаны только на небольшую выборку (n≤12) и ограниченное количество сопоставляемых замеров (c≤6).
В случае, если эти ограничения не выполняются, приходится использовать критерий χ²r Фридмана, рассмотренный в предыдущем параграфе.
В критерии L применяется такое же ранжирование условий по каждому испытуемому, как и в критерии х2r. Если испытуемый в первом опыте допустил 17 ошибок, во втором - 12, а в третьем - 5, то 1-й ранг получает третье условие, 2-й ранг - второе, а 3-й ранг - первое условие. После того, как значения всех испытуемых будут проранжированы, подсчитываются суммы рангов по каждому условию. Затем все условия располагаются в порядке возрастания ранговых сумм: на первом месте слева окажется условие с меньшей ранговой суммой, за нимусловие со следующей по величине ранговой суммой, и т. д., пока справа не окажется условие с самой большой ранговой суммой. Далее мы с помощью специальной формулы подсчета L проверяем, действительно ли значения возрастают слева направо. Эмпирическое значение критерия L отражает степень различия между ранговыми суммами, поэтому чем выше значение L, тем более существенны различия.
Гипотезы.
Но: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, случайно.
Н1: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, неслучайно.
При формулировке гипотез мы имеем в виду новую нумерацию условий, соответствующую предполагаемым тенденциям.
Символом достоверной, отчетливой тенденции в изменении показателей при переходе от условия к условию будет достаточно "собранная" ломаная кривая, устремленная кверху или, наоборот, книзу. Если на Рис. 3.6 характерной чертой всех индивидуальных кривых был крутой излом в одной и той же точке графика, то в данном случае на некоторых отрезках повышение кривой характеризуется большей крутизной, а на других - меньшей крутизной. Очевидно, достоверность тенденций будет обеспечиваться именно отрезками более крутого восхождения, но тест тенденций снисходительно распространит этот эффект и на более пологие отрезки.