Уровень статистической значимости, статистический критерий и число сте- пеней свободы

Статистическая значимость (сокр. Sig), или р-уровень значимости –основной ре- зультат проверки статистической гипотезы. Говоря техническим языком, это вероятность получения данного результата выборочного исследования при условии, что на самом деле для генеральной совокупности верна нулевая статистическая гипотеза – т.е. связи нет. Иначе говоря, это вероятность того, что обнаруженная связь носит случайный характер, а не явля- ется свойством совокупности. Именно статистическая значимость, р-уровень значимости яв- ляется количественной оценкой надежности связи: чем меньше эта вероятность, тем надеж- нее связь.

Предположим, при сравнении двух выборочных средних было получено значение уровня статистической значимости р=0,05. Это значит, что проверка статистической гипоте- зы о равенстве средних в генеральной совокупности показала, что если она верна, то вероят- ность случайного появления обнаруженных различий составляет не более 5%. Иначе говоря, если бы две выборки многократно извлекались из одной и той же генеральной совокупности, то в 1 из 20 случаев обнаруживалось бы такое же или большее различие между средними этих выборок. Т.е. существует 5% вероятность того, что обнаруженные различия носят слу- чайный характер, а не являются свойством совокупности.

В отношении научной гипотезы уровень статистической значимости – это количе- ственный показатель степени недоверия к выводу о наличии связи, вычисленный по резуль- татам выборочной, эмпирической проверки этой гипотезы. Чем меньше значение р-уровня, тем выше статистическая значимость результата исследования, подтверждающего научную гипотезу.

Уровень значимости при прочих равных условиях выше, если: а) величина связи (различия) больше;

б) изменчивость признака (признаков) меньше; в) объем выборки (выборок) больше.

Чем больше гипотез проверяется, тем выше шанс получить результат чисто слу- чайно – р-уровень увеличивается пропорционально количеству проверяемых гипотез!

Статистический критерий –это инструмент определения уровня статистической значимости. Назначение критерия – проверка статистической гипотезы путем определения р-уровня значимости (вероятности того, что Н0 верна). Выбор критерия определяется прове- ряемой статистической гипотезой.

Статистический критерий задает формулу для определения числа степеней свободы. Число степеней свободы (df) –это количество возможных направлений изменчивости при- знака. Как правило, число степеней свободы линейно зависит от объема выборки, от числа признаков или их градаций, - чем больше эти показатели, тем больше число степеней свобо- ды. В связи с тем, что для каждого случая df имеет свою специфику, подчеркнем лишь сле- дующее: каждая формула для расчета эмпирического значения критерия обязательно сопро- вождается правилом (формулой) для определения числа степеней свободы.

Статистический критерий включает в себя:

а) формулу расчета эмпирического значения критерия по выборочным статистикам; б) правило (формулу) определения числа степеней свободы;

в) теоретическое распределение для данного числа степеней свободы;

г) правило соотнесения эмпирического значения критерия с теоретическим распреде- лением для определения вероятности того, что Н0 верна.

При обработке данных на компьютере при помощи статистической программы (например, SPSS) исследователю достаточно указать программе, какой критерий (метод) необходимо применить к заданной выборке исходных данных. Далее программа сама вычис- ляет эмпирическое значение и сопоставляет его с теоретическим распределением. В качестве результата исследователь получает значение р-уровня значимости, наряду с эмпирическим значением критерия и числом степеней свободы.

Когда расчеты производятся «вручную», исследователь совершает более сложную по- следовательность действий для проверки гипотезы, включающую применение специальных таблиц критических значений критерия:

1. Выбор критерия в зависимости от вида исходных данных и статистической гипотезы.

2. Расчет по исходным данным (или по имеющимся статистикам) эмпирического зна- чения критерия и числа степеней свободы.

3. Применение «Таблицы критических значений критерия» позволяет определить зна- чение р-уровня для данного числа степеней свободы.

Таблица критических значений содержит значения (квантили) теоретического распре- деления, соответствующие наиболее важным – критическим значениям р-уровня (0,1; 0,05; 0,01; 0,001) для различных чисел степеней свободы.

Процедура определения р-уровня значимости (рис. 4):

1. Если эмпирическое значение критерия (Кэ) находится между двумя критическими значениями, то р-уровень меньше того критического р-уровня, которое находится левее.

2. Если Кэ находится левее крайнего левого критического значения (обычно это соот- ветствует критическому значению р=0,1, реже р=0,05), то р-уровень больше, чем крайнее правое критическое значение р-уровня.

3.

 
  Уровень статистической значимости, статистический критерий и число сте- пеней свободы - student2.ru

Если Кэ находится правее крайнего правого критического значения, то р-уровень меньше крайнего правого критического р-уровня.

Рис. 4 Процедура определения р-уровня значимости

Для разных критериев возможны разные соотношения между р-уровнем и величиной критических его значений.

Для большинства критериев (t, F, χ2 и др.) – чем больше значения критерия, тем выше

статистическая значимость (меньше р-уровень).

Для некоторых критериев зависимость обратная. Например, U-Манна-Уитни или Т- Вилкоксона убывают по мере увеличения уровня значимости (уменьшение р-уровня).

Тем не менее, правило остается общим, в соответствии с рисунком. Например, если tэ находится между t0,1 и t0,05, то р<0,1. И если Uэ находится между U0,1 и U0,05,, то р<0,1. Если же эмпирическое значение попадает левее критического р=0,1 (tэ<t0,1, но Uэ>U0,1), то уровень значимости определяется как р>0,1.

Проверка статистической гипотезы должна заканчиваться принятием статисти- ческого решения о том, какая же гипотеза верна: нулевая – об отсутствии связи или аль- тернативная – о её наличии. Соответственно, от этого зависит и окончательный, содержа-

тельный вывод исследования: подтверждена или нет исходная научная гипотеза. Решение исследователя зависит от того, какую вероятность ошибки он считает допустимой.

Традиционная интерпретация различных уровней значимости исходит из α=0,05. В соответствии с ней приемлемым для отклонения Н0 признается уровень р≤0,05. Такая отно- сительно высокая вероятность ошибки может быть рекомендована для небольших выборок.

Если объем выборок около 100 и более объектов, то порог отклонения Н0 целесооб- разно снизить до α=0,01 и принимать решение о наличии связи (различий) при р≤0,01.

Интерпретация уровней значимости представлена в таблице 2.

Таблица 2

Наши рекомендации