Критерии оценки достоверности сдвига в значениях

Исследуемого признака

1. G – критерий знаков.

2. Т – критерий Вилкоксона.

3. Критерий тенденций L Пейджа

4. X² – критерий Фридмена

5. Применение непараметрических критериев: классификация сдвигов и критериев оценки их статистической достоверности.

1. G – критерий знаков

Критерий знаков предназначен для установления общего направления сдвига исследуемого признака. Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму.

Критерий применим как к тем изменениям, которые могут быть определены только качественно (например, изменение отношения к чему-либо), так и к тем, которые могут быть измерены количественно (например, сокращение времени работы над заданием после экспериментального воздействия).

Под сдвигами понимается разница между значением n-ного наблюдения в первом и втором измерении. Иными словами, сдвиг – это разница между тем результатом, который показал n-ный испытуемый из выборки до и после экспериментального воздействия. В ходе эксперимента может стать видно, что, к примеру, у большинства испытуемых сдвиг произошел в положительную сторону (усиление признака; в ту сторону, которую предполагал исследователь и т.п.). Производится подсчет положительных, отрицательных и нулевых сдвигов (изменений не зафиксировано), затем последние исключаются из рассмотрения, что уменьшает фактический объем выборки. Согласно табличным данным, производится сопоставление и определение достоверности различий.

Преобладающие сдвиги принято называть «типичными», сдвиги в противоположную сторону – «нетипичными».

Гипотезы

Но. Преобладание направления сдвига является случайным.

Н 1.Преобладание направления сдвига не является случайным.

Ограничения критерия.

Объем выборки может находиться в диапазоне от 5 до 300 элементов.

Алгоритм подсчета G – критерия знаков

1. Подсчитать количество нулевых сдвигов и исключить их из рассмотрения. (При этом n уменьшится, и не должно стать меньше 5).

2. Определить преобладающее направление изменений. Считать сдвиги в преобладающем направлении «типичными».

3. Определить количество «нетипичных» сдвигов, считать это число эмпирическим значением G.

4. Определить из таблиц критическое значение для данного объема выборки и сопоставить с полученным эмпирическим значением G. В случае если эмпирическое число меньше или равно критическому, сдвиг в типичную сторону может считаться достоверным.

2. Т – критерий Вилкоксона

Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть, способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом.

Критерий применим в тех случаях, когда признаки измерены, по крайней мере, в порядковой шкале. Целесообразно применять данный критерий, когда величина самих сдвигов варьирует в некотором диапазоне (10-15% от их величины). Это объясняется тем, что разброс значений сдвигов должен быть таким, чтобы появлялась возможность их ранжирования. В случае если сдвиги незначительно отличаются между собой, и принимают какие-то конечные значения, например. +1, -1 и 0, формальных препятствий к применению критерия нет, но, ввиду большого числа одинаковых рангов, ранжирование утрачивает смысл, и те же результаты проще было бы получить с помощью критерия знаков.

Суть метода состоит в том, что мы сопоставляем абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Сдвиг в более часто встречающемся направлении принято считать «типичным», и наоборот.

Гипотезы

Но. Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.

Н1. Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.

Ограничения критерия

Объем выборки – от 5 до 50 элементов.

Нулевые сдвиги исключаются из рассмотрения. (Это требование можно обойти, переформулировав вид гипотезы. Например: сдвиг в сторону увеличения значений превышает сдвиг в сторону их уменьшения и тенденцию к сохранению на прежнем уровне.)

Алгоритм вычисления Т – критерия Вилкоксона

1. Составить список испытуемых в любом порядке, например, алфавитном.

2. Вычислить разность между индивидуальными значениями во втором и первом замерах. Определить, что будет считаться типичным сдвигом.

3. Согласно алгоритму ранжирования, проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг, и проверить совпадение полученной суммы рангов с расчетной.

4. Отметить каким-либо способом ранги, соответствующие сдвигам в нетипичном направлении. Подсчитать их сумму Т.

5. Определить критические значения Т для данного объема выборки. Если Т-эмп. меньше или равен Т-кр. – сдвиг в «типичную» сторону достоверно преобладает.

3. L – критерий тенденций Пейджа

Критерий L Пейджа применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых.

Критерий позволяет выявить тенденции в измерении величин признака при переходе от условия к условию. Его можно рассматривать как продолжение теста Фридмена, поскольку он не только констатирует различия, но и указывает на направление изменений.

Критерий позволяет проверить наши предположения об определенной возрастной или ситуативно обусловленной динамике тех или иных признаков. Он позволяет объединить несколько произведенных замеров единой гипотезой о тенденции изменения значений признака при переходе от замера к замеру. Если бы не его ограничения, критерий был бы незаменим в "продольных" или лонгитюдных исследованиях.

К сожалению, имеющиеся таблицы критических значений рассчитаны только на небольшую выборку (n≤12) и ограниченное количество сопоставляемых замеров (c≤6).

В случае, если эти ограничения не выполняются, приходится использовать критерий χ²r Фридмана, рассмотренный в предыдущем параграфе.

В критерии L применяется такое же ранжирование условий по каждому испытуемому, как и в критерии х2r. Если испытуемый в первом опыте допустил 17 ошибок, во втором - 12, а в третьем - 5, то 1-й ранг получает третье условие, 2-й ранг - второе, а 3-й ранг - первое условие. После того, как значения всех испытуемых будут проранжированы, подсчитываются суммы рангов по каждому условию. Затем все условия располагаются в порядке возрастания ранговых сумм: на первом месте слева окажется условие с меньшей ранговой суммой, за нимусловие со следующей по величине ранговой суммой, и т. д., пока справа не окажется условие с самой большой ранговой суммой. Далее мы с помощью специальной формулы подсчета L проверяем, действительно ли значения возрастают слева направо. Эмпирическое значение критерия L отражает степень различия между ранговыми суммами, поэтому чем выше значение L, тем более существенны различия.

Гипотезы.

Но: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, случайно.

Н1: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, неслучайно.

При формулировке гипотез мы имеем в виду новую нумерацию условий, соответствующую предполагаемым тенденциям.

Символом достоверной, отчетливой тенденции в изменении показателей при переходе от условия к условию будет достаточно "собранная" ломаная кривая, устремленная кверху или, наоборот, книзу. Если на Рис. 3.6 характерной чертой всех индивидуальных кривых был крутой излом в одной и той же точке графика, то в данном случае на некоторых отрезках повышение кривой характеризуется большей крутизной, а на других - меньшей крутизной. Очевидно, достоверность тенденций будет обеспечиваться именно отрезками более крутого восхождения, но тест тенденций снисходительно распространит этот эффект и на более пологие отрезки.

Наши рекомендации