Проверка выскакивающих результатов на промах
С помощью математической статистики, а именно методами проверки статистических гипотез, в ряде случаев удается установить, является ли результат наблюдения, резко отличающийся от остальных результатов выборки, промахом. Правда, достаточно разработан этот раздел статистики только для случая выборки, элементы которой подчиняются нормальному закону распределения.
Идея метода состоит в том, что подсчитывают вероятность получить отклонение результата наблюдения от среднего, равное отклонению подозрительного результата или большее. Если эта вероятность мала, то результат считают промахом и исключают из выборки, если же эта вероятность достаточно велика, то отклонение результата считают естественным в условиях нормального распределения и оставляют его.
Что значит “вероятность появления мала или велика”? Для решения этого вопроса задаются некоторым значением вероятности, которое отделяет область малых вероятностей от об-
- 18 -
ласти достаточно больших. Это граничное значение вероятности называется уровнем значимости и обозначается буквой b .
Если число наблюдений в выборке ( объем выборки ) порядка 10 , то вероятность появления каждого элемента порядка 0,1 или 10%. Поэтому в качестве границы маловероятных значений ( в качестве уровня значимости b ) выбирают вероятность 0,05 (5%) или даже 0,01 (1%). На практике вероятность обычно не считают, а пользуются уже готовыми таблицами, в которых для некоторых заранее заданных уровней значимости b ( обычно это 0,1; 0,05; 0,025; 0,01 ) подсчитаны значения критических отклонений, выраженных в относительных единицах :
V
где x - экстремальное (наибольшее или наименьшее) значение элемента выборки; - среднее значение - результат измерения, подсчитанный с использованием результата, подозреваемого на промах; S = - среднее квадратичное отклонение наблюдений, подсчитанное также с использованием подозреваемого результата.
Итак, для проверки подозреваемого результата на промах
а) вычисляют V ;
б) задаются уровнем значимости b ;
в) по соответствующей статистической таблице (например, табл.2 ) по выбранному значению b и объему выборки N находят ;
г) если , то оцениваемый результат про-
- 19 -
махом не является и оставляется в выборке, если же , то при уровне значимости b подозрительный результат следует считать промахом, исключить из выборки, а по оставшимся N - 1 результатам заново определить и , которыми и пользоваться при записи результата измерения.
Из сказанного следует, что проще не допустить промаха, используя перечисленные выше правила (внимательность, многократность, изменение легко контролируемых условий измерения и т.д.), чем исключить его методами математической статистики.