Выбор между параметрическими и непараметрическими
Тестами: легкая ситуация.
Выбор между параметрическими и непараметрическими тестами иногда достаточно прост: Вы должны четко выбрать параметрический тест, если Вы уверены, что Ваши данные были получены как выборка из популяции, которая соответствует нормальному распределению. Вы должны определенно выбирать непараметрический тест в следующих ситуациях:
· Результат является ранговым значением или оценочным значением и популяция явно не имеет нормального распределения. Примеры могут включать ранжирование студентов, шкалу Апгара, которая измеряет здоровье новорожденных (измеряется на шкале от 0 до 10 и все значения являются целыми), визуальную аналоговую шкалу боли (которая измеряется на непрерывной шкале где 0 - это отсутствие боли и 10 - это непереносимая боль), и так называемая звездочная шкала, которая используется критиками при оценке фильмов и ресторанов (*неплохо, ***** прекрасно).
· Некоторые значения очень резко отличаются от остальных, то есть слишком высокие или слишком низкие для измерений. Даже если популяция является Гауссовой невозможно анализировать такие данные параметрическим тестом, поскольку Вы не знаете всех значений. Использование с этими данными непараметрического теста достаточно простое: Вы присваиваете тем значениям, которые являются слишком низкими для того, чтобы их можно было измерить произвольное, но очень небольшое значение, и для очень больших значений Вы присваиваете произвольное, но очень большое значение, а затем выполняете непараметрический тест. Поскольку непараметрические тесты базируются только на информации о ранговом положении значений, тот факт, что Вы не знаете точных значений этих показателей уже не будет Вам сильно мешать.
· Данные, которые достаточно точно измерены, но Вы уверены, что популяция не распределяется в соответствии с нормальным законом. Если данные не получены из Гауссовского распределения, тогда Вы должны вначале подумать нельзя ли трансформировать значение так, чтобы оно превратилось в Гауссовское. Например, Вы можете взять логарифм или величину обратную всем значениям. Часто имеются биологические или химические причины (также как и статистические) для того, чтобы выполнить ту или иную трансформацию.
Выбор между параметрическими и непараметрическими
Тестами: сложные случаи.
Не всегда легко определить является ли выборка из Гауссовой популяции. Обратите внимание на следующие положения:
· Если Вы имеете большое количество наблюдений (100 или более) Вы можете посмотреть на распределение данных и совершенно четко будет видно насколько оно соответствует знаменитой колоколообразной кривой нормального распределения. Формальный статистический тест (тест Колмогорова-Смирнова) может использоваться для того, чтобы проанализировать вопрос насколько распределение данных отличается от Гауссова распределения. Когда у Вас имеется только небольшое количество наблюдений, очень сложно принять решение о том, следуют ли данные Гауссовому распределению и формальные тесты также имеют очень маленькую статистическую мощность для того, чтобы найти различие между Гауссовым и не Гауссовым распределением.
· Вы должны посмотреть на предыдущие данные. Помните, что то что Вас интересует - это распределение популяции в целом, а не распределение Вашей выборки. Принимая решение о том, является ли Ваше распределение нормальным, посмотрите на все имеющиеся данные, а не только на данные нынешнего эксперимента.
· Обратите внимание на источники разброса, когда разброс идет как результат суммы различных источников и ни один из источников не является основным источником разброса, у Вас скорее всего будет распределение Гаусса. Когда люди сомневаются, то некоторые выбирают параметрические тесты (поскольку они не уверены, что нарушается допущение о следовании нормальному закону распределения), а другие выбирают непараметрические тесты (поскольку они не уверены, что выполняются допущения о соответствии распределения Гаусса.