Статистические критерии различий
Одной из наиболее часто встречающихся статистических задач, с которыми сталкивается психолог, является задача сравнения результатов обследования какого-либо психологического признака в разных условиях измерения (например, до и после определенного воздействия) или обследования контрольной и экспериментальной групп. Помимо этого нередко возникает необходимость оценить характер изменения того или иного психологического показателя в одной или нескольких группах в разные периоды времени или выявить динамику изменения этого показателя под влиянием экспериментальных воздействий. Для решения подобных задач используется достаточно большой набор статистических способов, называемых в наиболее общем виде критериями различий. Эти критерия позволяют оценить степень статистической достоверности различий между разнообразными показателями, измеренными согласно плану проведения психологического исследования. Важно учитывать, что уровень достоверности различий включается в план проведения эксперимента. Другими словами, исследователь при постановке экспериментальной задачи априори выбирает уровень достоверности различий (как правило, от 5% и выше в зависимости от особенностей решаемой задачи), который будет считаться приемлемым.
Существует достаточно большое количество критериев различий. Каждый из них имеет свою специфику, различаясь между собой по различным основаниям. Одним из таких оснований является тип измерительной шкалы, для которой предназначен тот или иной критерий. Например, с помощью некоторых критериев можно обрабатывать данные, полученные только в номинальных шкалах. Ряд критериев дает возможность обрабатывать данные, полученные в порядковой, интервальной и шкале отношений.
Критерии различаются также по максимальному объему выборки, который они могут охватить, а также и по количеству выборок, которые можно сравнивать между собой с их помощью. Так, существуют критерии, позволяющие оценить различия сразу в трех и большем числе выборок. Некоторые критерии позволяют сопоставлять неравные по численности выборки.
Еще одним признаком, дифференцирующим критерии, служит само качество выборки: она может быть связной (зависимой) или несвязной (независимой). Выборки также могут быть взяты из одной или нескольких генеральных совокупностей. Именно эта характеристика выборки служит наиболее важным основанием, по которому, прежде всего, выбираются критерии.
Кроме того, критерии различаются по мощности. Как мы отмечали выше,
мощность критерия (1 – β )— это его способность выявлять различия или отклонять нулевую гипотезу, если она неверна. Напомним, что ошибке первого рода соответствует отказ от нулевой гипотезы (α). Можно сказать также, что мощность критерия характеризует его способность избегать ошибки второго рода (β).
Психолог может решать экспериментальные задачи с использованием разных статистических критериев. При этом возможна такая ситуация, что один критерий позволяет обнаружить различия, а другой критерий различий не выявляет. Последнее означает, что первый критерий оказывается более мощным, чем другой. В таком случае закономерно возникает вопрос: зачем использовать менее мощные критерии? Однако известно, что, как правило, чем мощнее критерий, тем более трудоемкой является процедура вычислений с его помощью. Более того, если значимые различия установлены с помощью менее мощного критерия, то более мощный, заведомо подтвердит факт существования этих различий. Следовательно, использование менее мощных критериев нередко бывает оправданным (прежде всего в целях экономии времени вычислений). Нельзя забывать при этом, что отсутствие достоверных различий, зафиксированное с помощью одного критерия, не является гарантией того, что более мощный критерий не установит их наличия.
В свете вышесказанного, не проще ли сразу применять только один, наиболее мощный критерий? Однако большое разнообразие критериев различия предоставляет следующие возможности:
o выбирать критерий, адекватный типу шкалы, в которой получены экспериментальные данные;
o работать со связными (зависимыми) и несвязными (независимыми) выборками;
o работать с неравными по объему выборками;
o выбирать из критериев разные по мощности (в зависимости от целей исследования)