Критерий вариационного размаха

Является одним из простых методов исключения грубой погрешности измерений (промаха). Для его использования определяют размах вариационного ряда упорядоченной совокупности наблюдений :

  . (3.6)

Если какой-либо член вариационного ряда, например , резко отличается от всех других, то производят проверку, используя следующее неравенство:

  (3.7)

где – выборочное среднее арифметическое значение, вычисленное после исключения предполагаемого промаха;

– критериальное значение.

Нулевую гипотезу (об отсутствии грубой погрешности) принимают, если указанное неравенство выполняется. Если не удовлетворяет условию (3.7), то этот результат исключают из вариационного ряда.

Коэффициент зависит от числа членов вариационного ряда n, что представлено в таблице 3.3.

Таблица 3.3 – Критерий вариационного размаха

8-9 10-11 12-15 16-22 23-25 26-63 64-150
1,7 1,6 1,5 1,4 1,3 1,2 1,1 1,0 0,9 0,8

Критерий Диксона

Критерий основан на предположении, что погрешности измерений подчиняются нормальному закону (предварительно необходимо построение гистограммы результатов наблюдений) и проверка гипотезы о принадлежности нормальному закону распределения. При использовании критерия вычисляют коэффициент Диксона (наблюдаемое значение критерия) для проверки наибольшего или наименьшего экстремального значения в зависимости от числа измерений. В таблице 3.4 приведены формулы для вычисления коэффициентов. Коэффициенты , применяют, когда имеется один выброс, а и - когда два выброса. Требуется первоначальное упорядочение результатов измерений (объема выборки). Критерий применяется, когда выборка может содержать более одной грубой погрешности.

Таблица 3.4 – Формулы коэффициентов Диксона

Число измерений (объем выборки) Коэффициент Диксона Для наименьшего экстремального значения параметра Для наибольшего экспериментального параметра
3-7

Продолжение таблицы 3.4

8-10
11-13
14-25

Вычисленные для выборки по формулам значения коэффициентов Диксона сравнивают с принятым (табличным) значением критерия Диксона (таблица 3.5).

Нулевая гипотеза об отсутствии грубой погрешности выполняется, если выполняется неравенство .

Если , то результат признается грубой погрешностью и исключается из дальнейшей обработки.

Таблица 3.5 – Критериальные значения коэффициентов Диксона (при принятом уровне значимости )

Статистика Число измерений при уровне значимости
0,1 0,05 0,02 0,01
0,886 0,679 0,557 0,482 0,434 0,941 0,765 0,642 0,560 0,507 0,976 0,846 0,729 0,644 0,586 0,988 0,899 0,780 0,698 0,637
0,479 0,441 0,409 0,554 0,512 0,477 0,631 0,587 0,551 0,683 0,636 0,597
0,517 0,490 0,467 0,576 0,546 0,521 0,538 0,605 0,578 0,679 0,642 0,615

Продолжение таблицы 3.5

0,462 0,472 0,452 0,438 0,424 0,412 0,401 0,391 0,382 0,374 0,367 0,360 0,546 0,525 0,507 0,490 0,475 0,462 0,450 0,440 0,430 0,421 0,413 0,406 0,602 0,579 0,559 0,542 0,527 0,514 0,502 0,491 0,481 0,472 0,464 0,457 0,641 0,616 0,595 0,577 0,561 0,547 0,535 0,524 0,514 0,505 0,497 0,489

3.5 Критерии , Райта

Критерий “правило трех сигм” является одним из простейших для проверки результатов, подчиняющихся нормальному закону распределения. Сущность правила трех сигм: если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения.

На практике правило трех сигм применяют так: если распределение изучаемой случайной величины неизвестно, но условие, указанное в приведенном правиле, выполняется, то есть основания предполагать, что изучаемая величина распределена нормально; в противном случае она не распределена нормально. С этой целью для выборки (включая подозрительный результат) вычисляется центр распределения и оценка СКО результата наблюдений. Результат, который удовлетворяет условию , считается имеющим грубую погрешность и удаляется, а ранее вычисленные характеристики распределения уточняются.

Этому критерию аналогичен критерий Райта, основанный на том, что если остаточная погрешность больше четырех сигм, то этот результат измерения является грубой погрешностью и должен быть исключен при дальнейшей обработке. Оба критерия надежны при числе измерений больше 20…50. Их правомочно применять, когда известна величина генерального среднеквадратического отклонения .

Может оказаться, что при новых значениях и другие результаты попадут в категорию аномальных. Однако, как доказано в /2/ дважды использовать критерии грубой погрешности не рекомендуется.

Критерий Смирнова

Критерий Смирнова используется при объемах выборки или при известных значениях генеральных среднего и СКО. Он устанавливает менее жесткие границы грубой погрешности. Для реализации этого критерия вычисляются действительные значения квантилей распределения (наблюдаемое значение критерия) по формуле:

  . (3.8)

Найденное значение сравнивается с критериальным , приведенным в таблице 3.6

Таблица 3.6 – Квантили распределения

Объем выборки n Предельное значение при уровне значимости
0,100 0,050 0,0010 0,005 0,001
1,282 1,645 2,326 2,576 3,090
1,632 1,955 2,575 2,807 3,290
1,818 2,121 2,712 2,935 3,403
1,943 2,234 2,806 3,023 3,481
2,036 2,319 2,877 3,090 3,540
2,111 2,386 2,934 3,143 3,588
2,172 2,442 2,981 3,188 3,628
2,224 2,490 3,022 3,227 3,662
2,269 2,531 3,057 3,260 3,692
2,309 2,568 3,089 3,290 3,719
2,457 2,705 3,207 3,402 3,820
2,559 2,799 3,289 3,480 3,890
2,635 2,870 3,351 3,539 3,944
2,696 2,928 3,402 3,587 3,988
2,792 3,015 3,480 3,662 4,054
2,860 3,082 3,541 3,716 4,108
3,076 3,285 3,723 3,892 4,263
3,339 3,534 3,946 4,108 4,465
3,528 3,703 4,108 4,263 4,607

Критерий Шовене

Критерий Шовене применяется для законов, не противоречащих нормальному, и строится на определении числа ожидаемых результатов наблюдений , которые имеют столь же большие погрешности, как и подозрительный. Гипотеза о наличии грубой погрешности принимается, если выполняется условие:

  .  

Порядок проверки гипотезы следующий:

1) вычисляются среднее арифметическое и СКО результатов наблюдений для всей выборки;

2) из таблицы нормированного нормального распределения (Приложение В – интегральная функция нормированного нормального распределения) по величине определяется вероятность появления подозрительного результата в генеральной совокупности чисел n:

  ; (3.9)

3) число ожидаемых результатов определяется по формуле:

  . (3.10)

Указанные выше критерии во многих случаях оказываются “жесткими”. Тогда рекомендуется пользоваться критерием грубой погрешности /4/, зависящим от объема выборки n и принятой доверительной вероятности Р.

Таблица 3.7 – Зависимость критерия грубой погрешности k от объема выборки n и доверительной вероятности Р

4,42 7,10 11,49 3,84 5,14 6,25
4,31 6,99 10,26 3,80 5,00 5,95
4,16 6,38 8,80 3,75 4,82 5,56
4,03 5,88 7,66 3,73 4,70 5,34
3,90 5,41 6,73        

Для распределений, отличных от нормального, таких классов, как двух модальных кругловершинных композиций нормального и дискретного распределения c эксцессом ; островершинных двумодальных; композиций дискретного двузначного распределения и распределения Лапласа с эксцессом ; композиций равномерного распределения с экспоненциальным распределением эксцесса и классом экспоненциальных распределений в пределах изменения эксцесса граница грубой погрешности определяется величиной или , где:

  , (3.11)

где – контрэксцесс;

  . (3.12)

Погрешности в определении оценок S СКО и являются отрицательно коррелированными, т. е. возрастание СКО S сопровождается уменьшением /3/. Поэтому определение границ грубой погрешности для законов, отличных от нормального, с эксцессом с помощью критерия является достаточно точным и может широко использоваться на практике.

Оценки , S и должны вычисляться после исключения подозрительных результатов из выборки. После расчета границ грубой погрешности результаты наблюдений, оказавшиеся внутри границ, возвращаются, а ранее найденные характеристики распределения уточняются.

Для равномерного распределения за границы грубой погрешности можно принять величину .

Рассмотрим пример применения критериев для исключения грубых погрешностей при измерении скорости ударной волны. Получены результаты, представленные в таблице 3.8.

Таблица 3.8 – Результаты наблюдений

Скорость , км/с 3,42 3,43 3,44 3,45 3,46 3,47 3,48 3,49 3,50
Частота

Требуется определить, не содержит ли результат наблюдения V=3,50 км/с грубую погрешность.

Для графического определения вида закона распределения построим гистограмму. При построении разбиение на интервалы осуществляем таким образом, чтобы измеренные значения оказались серединами интервалов, что показано на рисунке 3.2.

Рисунок 3.2 – Общий вид гистограммы

По виду гистограммы предположительно идентифицируем опытное распределение нормальным. Вычисляем оценки и S:

  км/с;  
  км/с.  

Решим задачу с помощью критериев, установленных для нормального распределения.

Проверка по критерию . Вычислим удаленность подозрительного результата от центра распределения: км/с.

Определим границу погрешности: км/с.

Поскольку | км/с < км/с, то можно сделать вывод, что результат км/с не содержит грубой погрешности.

Проверка по критерию Смирнова . Из таблицы 4.6 (n<25) для принятого уровня значимости и объема выборки находим . Наличие грубой погрешности в результате км/с подтверждается, так как:

км/с < км/с.

Проверка по критерию Романовского. Определяем характеристики распределения без учета подозрительного результата:

  км/с; км/с.  

По таблице 3.2 находим коэффициент Стьюдента при объеме выборки и доверительной вероятности ; . Наличие грубой погрешности подтверждается, т. к.:

  км/с > км/с.  

Проверка по критерию Шовене. При нахождении характеристик распределения участвуют все наблюдения и поэтому км/с; км/с.

Вычисляем квантиль по формуле:

  . (3.13)

В данном случае:

  .  

По таблице В.1 Приложения В определяем вероятность выхода результатов за квантиль :

  .  

Тогда ожидаемое число наблюдений с результатом км/с.

  .  

Так как , то приходим к выводу о наличии грубой погрешности в результате наблюдения км/с.

Поскольку большинство критериев (3 из 4-х рассматриваемых) показали наличие грубой погрешности, то результат наблюдения необходимо исключить из выборки.

Наши рекомендации