Ii. индуктивная статистика
1. Задача индуктивной статистики заключается в том, чтобы оценить значимость тех различий, которые могут быть между двумя распределениями, с целью выяснить, можно ли распространить найденную закономерность на всю популяцию, из которой были взяты выборки.
2. Для того чтобы определить, достоверны ли различия между распределениями, следует выдвинуть гипотезу, которую нужно будет затем проверить статистическими методами. Нулевой гипотезой называют предположение, согласно которому различие между распределениями недостоверно, тогда как альтернативная гипотеза утверждает противоположное.
3. В том случае, если данных достаточно, если эти данные количественные и подчиняются нормальному распределению, для проверки гипотез используют параметрические критерии. Если же данных мало либо они являются порядковыми или качественными (см. дополнение Б.1), используют непараметрические критерии.
4. Из параметрических критериев наиболее эффективен и чаще всего используется критерий t Стьюдента. Этот критерий позволяет сравнить средние и стандартные отклонения для двух распределений. В случае если эти показатели принадлежат независимым выборкам, используют формулу
Для сопряженных выборок используют иную формулу:
5. Если необходимо сравнить три или большее число распределений, используют иной параметрический метод.-дисперсионный анализ. При этом с помощью метода Шеффе можно выявить пары выборок, различия между которыми достоверны либо недостоверны.
6. Критерий c2 (хи-квадрат) - это непараметрический критерий, позволяющий проверить, являются ли две переменные независимыми друг от друга. По этому методу сравнивают, как распределяются эмпирические частоты в зависимости от критериев для каждой переменной, с тем, как они распределились бы теоретически, если бы переменные были независимыми. Далее с помощью таблицы, в которую сводятся все частоты, вычисляют критерий c2. Для этого сначала находят разницу между каждой эмпирической (Э) и соответствующей теоретической (Т) частотой, а затем сумму этих разностей:
c2 = å
7. Критерий знаков (биномиальный тест) - еще один непараметрический метод, позволяющий легко определить, оказала ли независимая переменная существенное влияние по сравнению с исходным уровнем (фоном). Для этого сначала подсчитывают число «ухудшений» (-) или число «улучшений» ( + ), а затем сравнивают одно из этих двух чисел с тем, что могло бы получиться в результате чистой случайности (1 шанс из 2, или n/2). Для этого применяют формулу
8. Существуют и другие непараметрические тесты, которые приходится использовать для проверки гипотез тогда, когда нельзя применить параметрические критерии. К этим методам, в частности, относится критерий рангов, позволяющий определить, случайна или нет очередность событий в той или иной последовательности, а также критерий U и критерий Т. Последние два критерия используют в случае порядковых переменных соответственно для независимых и зависимых выборок.
9. Какой бы критерий ни использовался, его вычисленное значение следует сравнить с табличным для уровня значимости 0,05 с учетом числа степеней свободы. Если при этом вычисленный результат окажется выше, нулевая гипотеза может быть отвергнута и можно, следовательно, утверждать, что разница достоверна.