Краткий обзор непараметрических методов
По существу, для каждого параметрического критерия имеется, по крайней мере, один непараметрический аналог. Эти критерии можно отнести к одной из следующих групп:
- описательные статистики;
- критерии различия между независимыми выборками (группами);
- критерии различия между зависимыми выборками;
- критерии зависимости между СВ.
Описательные статистики
Наиболее важными параметрами описательной статистики, в изучаемом контексте, являются критерии проверки типа распределения, прежде всего на предмет соответствия его нормальному типу. Существует значительное число критериев согласия, предназначенных для данной цели. Наиболее популярны из них показатели асимметрии и эксцесса, критерии Шапиро-Уилка, Колмогорова-Смирнова.
Дело в том, что если данные не являются нормально распределенными, то вычисление обычных описательных статистик (например, среднего, стандартного отклонения) не слишком информативно. Например, в психофизиологии известен закон Вебера-Фехнера, согласно которому, воспринимаемая интенсивность стимулов (например, субъективно воспринимаемая яркость света) представляет собой логарифмическую функцию реальной интенсивности (яркости, измеренной в объективных единицах – люксах). В данном примере, обычное среднее арифметическое не дает верного представления о среднем значении действительной интенсивности стимула. Здесь скорее следует вычислить среднее геометрическое. В подобных случаях вычисляются и другие непараметрические описательные показатели: медиана, мода, гармоническое среднее, геометрическое среднее, квартильный размах и т.д.
Различия между независимыми выборками
Обычно, когда имеются две выборки (например, мужчины и женщины), средние которых нужно сравнить, используется t-критерий для независимых выборок (в программе Excel это ТТЕСТ). Непараметрической альтернативой этому критерию является, например, U-критерий Манна-Уитни.
Если сравниваются частоты качественных признаков, то используется, например, критерий хи-квадрат.
Если нужно сравнить несколько групп, то используется дисперсионный анализ. Его непараметрическим аналогом является ранговый дисперсионный анализ Краскела-Уоллиса.
Различия между зависимыми группами
Если нужно сравнить две СВ, относящиеся к одной и той же выборке (например, количество лейкоцитов в начале и в конце лечения), то обычно используется t-критерий для зависимых выборок.
Альтернативным непараметрическим тестом является парный W-критерий Вилкоксона. Если рассматриваются качественные признаки, категориальные по своей природе (т.е. представлены в виде частот случаев, попавших в определенные категории), то подходящим будет критерий хи-квадрат Макнимара.
Если рассматривается более двух переменных, относящихся к одной и той же выборке, то обычно используется дисперсионный анализ (ANOVA) с повторными измерениями. Альтернативным непараметрическим методом является ранговый дисперсионный анализ Фридмана или Q-критерий Кочрена. Последний применяется также для оценки изменений частот (долей).
Зависимости (связи) между переменными
Для оценки зависимости между двумя переменными (например, между дозой лекарства и его фармакодинамическим эффектом), обычно вычисляют линейный коэффициент корреляции Пирсона r. Его непараметрическим аналогом является коэффициент Спирмена R..
Если две рассматриваемые переменные по природе своей категориальны, то подходящими непараметрическими критериями для тестирования зависимости будут: Хи-квадрат и точный критерий Фишера.
Для оценки зависимости между несколькими переменными применяется коэффициент конкордации Кендалла. Этот тест часто используется для оценки согласованности мнений независимых экспертов, выраженных в баллах, выставленных одному и тому же субъекту.
Программное обеспечение