Статистическая обработка результатов многократных измерений

Прямые многократные измерения делятся на равно- и нерав­ноточные. Равноточными называются измерения, которые производятся средствами измерения одинаковой точности по од­ной и той же методике при неизменных внешних условиях. При равноточных измерениях средние квадратические отклонения (СКО) результатов всех рядов измерений равны между собой.

Задача обработки результатов многократных измерений за­ключается в нахождении оценки измеряемой величины и довери­тельного интервала, в котором находится её истинное значение. Обработка должна проводиться в соответствии с ГОСТ 8.207-76 «ГСИ. Прямые измерения с многократными наблюдениями. Ме­тоды обработки результатов наблюдений. Общие положения».

Исходной информацией для обработки является ряд из п > 4 результатов измерения х1, х2, x3, ..., xп из которых ис­ключены известные систематические погрешности - выборка. Число п зависит как от требований к точности получаемого ре­зультата, так и от реальной возможности выполнять повторные измерения.

Последовательность обработки результатов прямых много­кратных измерений состоит из ряда этапов.

1-й этап: определение точечных оценок закона распределения результатов измерений. На этом этапе определяются:

- среднее арифметическое значение измеряемой величины по формуле

Статистическая обработка результатов многократных измерений - student2.ru , (3.1)

где Xi – результат i-го единичного измерения; n – число единичных измерений в ряду.

Величина X, полученная в одной серии измерений, является случайным приближением к Xист. Для оценки ее возможных отклонений от Xист (случайной погрешности среднего арифметического значения результата измерений одной и той же величины в одном ряду измерений) определяют среднюю квадратичную погрешность (СКП)

Статистическая обработка результатов многократных измерений - student2.ru , (3.2)

которая получена из ряда равноточных измерений.

Для оценки рассеяния единичных результатов измерений в ряду равноточных измерений одной и той же физической величины около среднего их значения используют СКП:

Статистическая обработка результатов многократных измерений - student2.ru , при n<20 (3.3)

или

Статистическая обработка результатов многократных измерений - student2.ru , при n Статистическая обработка результатов многократных измерений - student2.ru 20, (3.4)

отсюда Статистическая обработка результатов многократных измерений - student2.ru , т.е. СКП из серии измерений всегда меньше, чем в каждом отдельном измерении, отсюда следует, что для повышения точности измерений необходимо увеличивать число измерений.

В соответствии с критериями грубые погрешности и промахи исключаются, после чего проводится повторный расчёт оценок среднего арифметического значения и его СКП.

2-й этап: определение закона распределения результатов из­мерения или случайных погрешностей измерения. В последнем случае от выборки результатов измерения х1, х2, x3, ..., xп пере­ходят к выборке отклонений от среднего арифметического.

Первым шагом при идентификации закона распределения яв­ляется построение по исправленным результатам измерения хi, где i = 1, 2,..., п, вариационного ряда (упорядоченной выборки), в котором результаты измерения (или их отклонения от среднего арифметического) располагают в порядке возрастания от xmin до xmax. Далее этот ряд разбивается на оптимальное число т, как правило, одинако­вых интервалов группирования длиной, которая вычисляется по формуле:

h = (xmax-xmin)/m, (3.5)

где m – число интервалов, находящееся в пределах от mmin = 0,55 п 0,4 до mmax = 1,25 n 0,4.

Искомое значение т должно быть нечётным, так как при чётном т в ост­ровершинном или двухмодальном симметричном распределении результатов измерения в центре гистограммы оказываются два равных по высоте столб­ца и середина кривой распределения искусственно уплощается. В случае, если гистограмма распределения явно двухмодальная, число столбцов может быть увеличено в 1,5—2 раза, чтобы на каждый из двух максимумов приходилось примерно по т интер­валов. Полученное значение длины интервала группирования h всегда округляют в большую сторону, иначе последняя точка окажется за пределами крайнего интервала.

Далее определяют интервалы группирования эксперименталь­ных данных в виде x0…x1 ; x1…x2 ; …; xk-1…xk. и подсчитывают число попаданий nk результатов измерения в каждый интервал группирования. Сумма этих чисел должна равняться числу измерений. По полученным значениям рассчитывают вероятности попадания результатов из­мерения (частоты) в каждый из интервалов группирования по формуле Pk=nk/n и кумулятивную (накопленную) частоту:

Статистическая обработка результатов многократных измерений - student2.ru , (3.6)

где k –номер строки в табл. 3.1 с результатами расчетов.

Результаты расчетов Таблица 3.1

№ строки интервал Число наблюдений nk Частота Pk Кумулятивная частота Fk
x0…x1 n1 n1/n n1/n
x1…x2 n2 n2/n (n1+n2)/n
…. …. ….
k xk-1…xk nk nk/n (n1+n2+..+nk)/n

Проведенные расчёты позволяют построить гистограмму, по­лигон и кумулятивную кривую. Используем данные второго, четвёртого и пятого столбцов таблицы. Для построения гистограммы по оси результатов наблюдений х (рис. 3.3а) откладываются интерва­лы группирования в порядке возрастания номеров и на каждом интервале строится прямоугольник высотой рk. При увеличении числа интервалов и, со­ответственно, при уменьшении их длины гистограмма всё более приближается к гладкой кривой-графику плотности распределе­ния вероятности. Следует отметить, что в ряде случаев произво­дят расчётное симметрирование гистограммы.

Полигон представляет собой ломаную кривую, соединяющую середины верхних оснований каждого столбца гистограммы (рис. 3.3а). Он более наглядно, чем гистограмма, отражает форму кривой распределения. За пределами гистограммы справа и слева остаются пустые интервалы, в которых точки, соответствующие их серединам, лежат на оси абсцисс. Эти точки при построении полигона соединяют между собой отрезками прямых линий. В результате совместно с осью х обра­зуется замкнутая фигура, площадь которой пропорциональна числу наблюдений п.

Кумулятивная кривая - это график статистической функции распределения. Для её построения по оси результатов наблюде­ний х (рис. 3.3б) откладывают интервалы группирования в порядке возраста­ния номеров и на каждом интервале строят прямоугольник высотой­ Fk.

Статистическая обработка результатов многократных измерений - student2.ru

Рис.3.3. Гистограмма:

Полигон (а) и кумулятивная кривая (б)

По виду построенных зависимостей может быть оценен закон распределения результатов измерения.

3-и этап: оценка закона распределения по статистическим кри­териям и идентификация формы распределения результатов измерения. В качестве способа оценки близости распределения выборки экспериментальных данных к принятой аналитической модели закона распределения используются критерии согласия. Известен целый ряд критериев согласия, предложенных разными авторами. При числе наблюдений п > 50 для идентификации зако­на распределения используется критерий Пирсона или критерий Мизеса - Смирнова. При числе наблюдений 50 > п > 15 для проверки нормальности закона распределения применяется со­ставной критерий (d-критерий), приведенный в ГОСТ 8.207 - 76. При числе наблюдений п< 15 принадлежность эксперимен­тального распределения к нормальному не проверяется.

Наибольшее распространение в практике получил кри­терий Пирсона. Идея этого метода состоит в контроле отклоне­ний гистограммы экспериментальных данных от гистограммы с таким же числом интервалов, построенной на основе распределе­ния, совпадение с которым определяется. Использование крите­рия Пирсона возможно при большом числе измерений (п > 50) и заключается в вычислении величины c2 (хи-квадрат):

(3.7)
Статистическая обработка результатов многократных измерений - student2.ru

где ni;, Ni - экспериментальные и теоретические значения час­тот в i-м интервале разбиения; т - число интервалов разбиения.

При n → ∞ случайная величина c2 имеет распределе­ние Пирсона с так называемым числом степеней свободы v = т - 1 - r, где r -число определяемых по статистике параметров, необходимых для совмещения модели и гистограммы. Для нормального закона распределения r = 2, так как закон однозначно характеризуется указанием двух его параметров - математического ожидания и СКП.

Если бы выбранная модель в центрах всех т столбцов совпа­дала с экспериментальными данными, то все т разностей (пi - Ni) были бы равны нулю, а следовательно, и значение крите­рия также было бы равно нулю. Таким образом, c2 есть мера суммарного отклонения между моделью и экспериментальным распределением.

Критерий c2 не инвариантен числу столбцов и существенно возрастает с увеличением их числа. Поэтому для использования его при разном числе столбцов составлены таблицы квантилей распределения c2, входом в которые служит число степеней свободы v. Чтобы совместить мо­дель, соответствующую нормальному закону, с гистограммой, необходимо совместить координату центра, а для того, чтобы ширина модели соответствовала ширине гистограммы, её нужно задать как r=2 и V=т—3.

Если вычисленная по опытным данным мера расхождения c2 меньше определённого из таблицы значения c2 q , то гипотеза о совпадении экспериментального и выбранного теоретического распределений принимается. Это не значит, что гипотеза верна. Можно лишь утверждать, что она правдоподобна, т.е. она не противоречит опытным данным. Если же c2 выходит за грани­цы доверительного интервала, то гипотеза отвергается как противоречащая опытным данным.

Методика определения соответствия экспериментального и принятого законов распределения заключается в следующем: оп­ределяют оценки среднего арифметического значения Статистическая обработка результатов многократных измерений - student2.ru и средней квадратической погрешности S по формулам (3.1) … (3.4); группируют результаты многократных наблюдений по интервалам длиной h, число которых опреде­ляют так же, как и при построении гистограммы; для каждого интервала разбиения определяют его центр хiо и подсчитывают число наблюдений пi, попавших в каждый интервал; вычисляют число наблюдений для каждого из интервалов, теоретически су­ществующее в выбранной аналитической модели распределения. Для этого сначала от реальных середин интервалов хi0 произво­дят переход к нормированным серединам Статистическая обработка результатов многократных измерений - student2.ru . Затем для каждого значения zi с помощью аналитической мо­дели находят значение функции плотности вероятностей f(zi). Например, для нормального закона значение функции плотно­сти вероятностей равно:

Статистическая обработка результатов многократных измерений - student2.ru

По найденному значению f (zi) определяют ту часть Ni имеющихся наблюдений, которая теоретически должна быть в каждом из интервалов

Статистическая обработка результатов многократных измерений - student2.ru ,

где п - общее число наблюдений; если в какой-либо интервал теоретически попадает меньше пяти наблюдений, то в обеих гистограммах его соединя­ют с соседним интервалом. После этого определяют число степе­ней свободы v = т - 1 - r, где т - общее число интервалов. Если было произведено укрупнение, то т - число интервалов после укрупнения; по формуле (3.7) определяют показатель разно­сти частот c2 , выбирают уровень значимости критерия q, который должен быть небольшим. По уровню значимости и числу сте­пеней свободы v по табл. 3.2 находят границу критической об­ласти c2 q такую, что Р {c2 > c2 q} = q. Вероятность того, что полученное значение c2 превышает c2 q , равна q и мала. По­этому если оказывается, что c2 >c2 q, то гипотеза о совпадении экспериментального и теоретического законов распределения отвергается. Если же c2 <c2 q то гипотеза принимается.

Таблица 3.2

Значения c2 q при различном уровне значимости

v   c2 q при уровне значимости q, равном  
0,99   0,95   0,9   0,8   0,5   0,2   0,1   0,05   0,02  
  0,02   0,10   0,21   0,45   1,39   3,22   4,61   5,99   7,82  
  0,30   0,71   1,06   1,65   3,36   5,99   7,78   9,49   11,67  
  0,87   1,63   2,20   3,07   5,35   8,56   10,65   12,59   15,03  
  1,65   2,73   3,49   4,59   7,34   11,03   13,36   15,51   18,17  
  2,56   3,94   4,87   6,18   9,34   13,44   15,99   18,31   21,16  
  3,57   5,23   6,30   7,81   11,34   15,81   18,55   21,03   24,05  
  4,66   6,57   7,79   9,47   13,34   18,15   21,06   23,69   26,87  
  5,81   7,96   9,31   11,20   15,34   20,46   23,54   26,30   29,63  
  8,26   10,85   12,44   14,58   19,34   25,04   28,41   31,41   35,02  
  11,52   14,61   16,47   18,94   24,34   30,68   34,38   37.65   41,57  
  14,95   18,46   20,60   23,36   29,34   36,25   40,26   43,77   47,96  

Чем меньше q, тем больше значение c2 q (при том же числе степеней свободы v), тем легче выполняется условие c2 < c2 q и принимается проверяемая гипотеза. Не рекомендуется принимать 0,02£q£ 0,1.

4-й этап: определение доверительных границ случайной по­грешности. Если удалось идентифицировать закон распределения результатов измерения, то с его использованием находят квантильный множитель tp при заданном значении доверительной вероятности Р. В этом случае доверительные границы случайной погрешности имеют вид:

Статистическая обработка результатов многократных измерений - student2.ru . (3.8)

Обычно задаются доверительной вероятностью, равной одной из следующих величин: 0,90; 0,95; 0,99; 0,999, что соответствует значениям tp, равным 1,645; 1,96; 2,576 и 3,291.

5-й этап: запись результата измерения. Результат измерения записывается в виде х = Статистическая обработка результатов многократных измерений - student2.ru ± Dр при доверительной вероятности Р.

При отсутствии данных о виде функции распределения, составляющих погрешности, результаты измерения представляют в виде Статистическая обработка результатов многократных измерений - student2.ru , S, п, Θ при доверительной вероятности Р.

Наши рекомендации