Статистическая обработка результатов многократных измерений
Прямые многократные измерения делятся на равно- и неравноточные. Равноточными называются измерения, которые производятся средствами измерения одинаковой точности по одной и той же методике при неизменных внешних условиях. При равноточных измерениях средние квадратические отклонения (СКО) результатов всех рядов измерений равны между собой.
Задача обработки результатов многократных измерений заключается в нахождении оценки измеряемой величины и доверительного интервала, в котором находится её истинное значение. Обработка должна проводиться в соответствии с ГОСТ 8.207-76 «ГСИ. Прямые измерения с многократными наблюдениями. Методы обработки результатов наблюдений. Общие положения».
Исходной информацией для обработки является ряд из п > 4 результатов измерения х1, х2, x3, ..., xп из которых исключены известные систематические погрешности - выборка. Число п зависит как от требований к точности получаемого результата, так и от реальной возможности выполнять повторные измерения.
Последовательность обработки результатов прямых многократных измерений состоит из ряда этапов.
1-й этап: определение точечных оценок закона распределения результатов измерений. На этом этапе определяются:
- среднее арифметическое значение измеряемой величины по формуле
, (3.1)
где Xi – результат i-го единичного измерения; n – число единичных измерений в ряду.
Величина X, полученная в одной серии измерений, является случайным приближением к Xист. Для оценки ее возможных отклонений от Xист (случайной погрешности среднего арифметического значения результата измерений одной и той же величины в одном ряду измерений) определяют среднюю квадратичную погрешность (СКП)
, (3.2)
которая получена из ряда равноточных измерений.
Для оценки рассеяния единичных результатов измерений в ряду равноточных измерений одной и той же физической величины около среднего их значения используют СКП:
, при n<20 (3.3)
или
, при n 20, (3.4)
отсюда , т.е. СКП из серии измерений всегда меньше, чем в каждом отдельном измерении, отсюда следует, что для повышения точности измерений необходимо увеличивать число измерений.
В соответствии с критериями грубые погрешности и промахи исключаются, после чего проводится повторный расчёт оценок среднего арифметического значения и его СКП.
2-й этап: определение закона распределения результатов измерения или случайных погрешностей измерения. В последнем случае от выборки результатов измерения х1, х2, x3, ..., xп переходят к выборке отклонений от среднего арифметического.
Первым шагом при идентификации закона распределения является построение по исправленным результатам измерения хi, где i = 1, 2,..., п, вариационного ряда (упорядоченной выборки), в котором результаты измерения (или их отклонения от среднего арифметического) располагают в порядке возрастания от xmin до xmax. Далее этот ряд разбивается на оптимальное число т, как правило, одинаковых интервалов группирования длиной, которая вычисляется по формуле:
h = (xmax-xmin)/m, (3.5)
где m – число интервалов, находящееся в пределах от mmin = 0,55 п 0,4 до mmax = 1,25 n 0,4.
Искомое значение т должно быть нечётным, так как при чётном т в островершинном или двухмодальном симметричном распределении результатов измерения в центре гистограммы оказываются два равных по высоте столбца и середина кривой распределения искусственно уплощается. В случае, если гистограмма распределения явно двухмодальная, число столбцов может быть увеличено в 1,5—2 раза, чтобы на каждый из двух максимумов приходилось примерно по т интервалов. Полученное значение длины интервала группирования h всегда округляют в большую сторону, иначе последняя точка окажется за пределами крайнего интервала.
Далее определяют интервалы группирования экспериментальных данных в виде x0…x1 ; x1…x2 ; …; xk-1…xk. и подсчитывают число попаданий nk результатов измерения в каждый интервал группирования. Сумма этих чисел должна равняться числу измерений. По полученным значениям рассчитывают вероятности попадания результатов измерения (частоты) в каждый из интервалов группирования по формуле Pk=nk/n и кумулятивную (накопленную) частоту:
, (3.6)
где k –номер строки в табл. 3.1 с результатами расчетов.
Результаты расчетов Таблица 3.1
№ строки | интервал | Число наблюдений nk | Частота Pk | Кумулятивная частота Fk |
x0…x1 | n1 | n1/n | n1/n | |
x1…x2 | n2 | n2/n | (n1+n2)/n | |
…. | …. | … | … | …. |
k | xk-1…xk | nk | nk/n | (n1+n2+..+nk)/n |
Проведенные расчёты позволяют построить гистограмму, полигон и кумулятивную кривую. Используем данные второго, четвёртого и пятого столбцов таблицы. Для построения гистограммы по оси результатов наблюдений х (рис. 3.3а) откладываются интервалы группирования в порядке возрастания номеров и на каждом интервале строится прямоугольник высотой рk. При увеличении числа интервалов и, соответственно, при уменьшении их длины гистограмма всё более приближается к гладкой кривой-графику плотности распределения вероятности. Следует отметить, что в ряде случаев производят расчётное симметрирование гистограммы.
Полигон представляет собой ломаную кривую, соединяющую середины верхних оснований каждого столбца гистограммы (рис. 3.3а). Он более наглядно, чем гистограмма, отражает форму кривой распределения. За пределами гистограммы справа и слева остаются пустые интервалы, в которых точки, соответствующие их серединам, лежат на оси абсцисс. Эти точки при построении полигона соединяют между собой отрезками прямых линий. В результате совместно с осью х образуется замкнутая фигура, площадь которой пропорциональна числу наблюдений п.
Кумулятивная кривая - это график статистической функции распределения. Для её построения по оси результатов наблюдений х (рис. 3.3б) откладывают интервалы группирования в порядке возрастания номеров и на каждом интервале строят прямоугольник высотой Fk.
Рис.3.3. Гистограмма:
Полигон (а) и кумулятивная кривая (б)
По виду построенных зависимостей может быть оценен закон распределения результатов измерения.
3-и этап: оценка закона распределения по статистическим критериям и идентификация формы распределения результатов измерения. В качестве способа оценки близости распределения выборки экспериментальных данных к принятой аналитической модели закона распределения используются критерии согласия. Известен целый ряд критериев согласия, предложенных разными авторами. При числе наблюдений п > 50 для идентификации закона распределения используется критерий Пирсона или критерий Мизеса - Смирнова. При числе наблюдений 50 > п > 15 для проверки нормальности закона распределения применяется составной критерий (d-критерий), приведенный в ГОСТ 8.207 - 76. При числе наблюдений п< 15 принадлежность экспериментального распределения к нормальному не проверяется.
Наибольшее распространение в практике получил критерий Пирсона. Идея этого метода состоит в контроле отклонений гистограммы экспериментальных данных от гистограммы с таким же числом интервалов, построенной на основе распределения, совпадение с которым определяется. Использование критерия Пирсона возможно при большом числе измерений (п > 50) и заключается в вычислении величины c2 (хи-квадрат):
|
где ni;, Ni - экспериментальные и теоретические значения частот в i-м интервале разбиения; т - число интервалов разбиения.
При n → ∞ случайная величина c2 имеет распределение Пирсона с так называемым числом степеней свободы v = т - 1 - r, где r -число определяемых по статистике параметров, необходимых для совмещения модели и гистограммы. Для нормального закона распределения r = 2, так как закон однозначно характеризуется указанием двух его параметров - математического ожидания и СКП.
Если бы выбранная модель в центрах всех т столбцов совпадала с экспериментальными данными, то все т разностей (пi - Ni) были бы равны нулю, а следовательно, и значение критерия также было бы равно нулю. Таким образом, c2 есть мера суммарного отклонения между моделью и экспериментальным распределением.
Критерий c2 не инвариантен числу столбцов и существенно возрастает с увеличением их числа. Поэтому для использования его при разном числе столбцов составлены таблицы квантилей распределения c2, входом в которые служит число степеней свободы v. Чтобы совместить модель, соответствующую нормальному закону, с гистограммой, необходимо совместить координату центра, а для того, чтобы ширина модели соответствовала ширине гистограммы, её нужно задать как r=2 и V=т—3.
Если вычисленная по опытным данным мера расхождения c2 меньше определённого из таблицы значения c2 q , то гипотеза о совпадении экспериментального и выбранного теоретического распределений принимается. Это не значит, что гипотеза верна. Можно лишь утверждать, что она правдоподобна, т.е. она не противоречит опытным данным. Если же c2 выходит за границы доверительного интервала, то гипотеза отвергается как противоречащая опытным данным.
Методика определения соответствия экспериментального и принятого законов распределения заключается в следующем: определяют оценки среднего арифметического значения и средней квадратической погрешности S по формулам (3.1) … (3.4); группируют результаты многократных наблюдений по интервалам длиной h, число которых определяют так же, как и при построении гистограммы; для каждого интервала разбиения определяют его центр хiо и подсчитывают число наблюдений пi, попавших в каждый интервал; вычисляют число наблюдений для каждого из интервалов, теоретически существующее в выбранной аналитической модели распределения. Для этого сначала от реальных середин интервалов хi0 производят переход к нормированным серединам . Затем для каждого значения zi с помощью аналитической модели находят значение функции плотности вероятностей f(zi). Например, для нормального закона значение функции плотности вероятностей равно:
По найденному значению f (zi) определяют ту часть Ni имеющихся наблюдений, которая теоретически должна быть в каждом из интервалов
,
где п - общее число наблюдений; если в какой-либо интервал теоретически попадает меньше пяти наблюдений, то в обеих гистограммах его соединяют с соседним интервалом. После этого определяют число степеней свободы v = т - 1 - r, где т - общее число интервалов. Если было произведено укрупнение, то т - число интервалов после укрупнения; по формуле (3.7) определяют показатель разности частот c2 , выбирают уровень значимости критерия q, который должен быть небольшим. По уровню значимости и числу степеней свободы v по табл. 3.2 находят границу критической области c2 q такую, что Р {c2 > c2 q} = q. Вероятность того, что полученное значение c2 превышает c2 q , равна q и мала. Поэтому если оказывается, что c2 >c2 q, то гипотеза о совпадении экспериментального и теоретического законов распределения отвергается. Если же c2 <c2 q то гипотеза принимается.
Таблица 3.2
Значения c2 q при различном уровне значимости
v | c2 q при уровне значимости q, равном | ||||||||
0,99 | 0,95 | 0,9 | 0,8 | 0,5 | 0,2 | 0,1 | 0,05 | 0,02 | |
0,02 | 0,10 | 0,21 | 0,45 | 1,39 | 3,22 | 4,61 | 5,99 | 7,82 | |
0,30 | 0,71 | 1,06 | 1,65 | 3,36 | 5,99 | 7,78 | 9,49 | 11,67 | |
0,87 | 1,63 | 2,20 | 3,07 | 5,35 | 8,56 | 10,65 | 12,59 | 15,03 | |
1,65 | 2,73 | 3,49 | 4,59 | 7,34 | 11,03 | 13,36 | 15,51 | 18,17 | |
2,56 | 3,94 | 4,87 | 6,18 | 9,34 | 13,44 | 15,99 | 18,31 | 21,16 | |
3,57 | 5,23 | 6,30 | 7,81 | 11,34 | 15,81 | 18,55 | 21,03 | 24,05 | |
4,66 | 6,57 | 7,79 | 9,47 | 13,34 | 18,15 | 21,06 | 23,69 | 26,87 | |
5,81 | 7,96 | 9,31 | 11,20 | 15,34 | 20,46 | 23,54 | 26,30 | 29,63 | |
8,26 | 10,85 | 12,44 | 14,58 | 19,34 | 25,04 | 28,41 | 31,41 | 35,02 | |
11,52 | 14,61 | 16,47 | 18,94 | 24,34 | 30,68 | 34,38 | 37.65 | 41,57 | |
14,95 | 18,46 | 20,60 | 23,36 | 29,34 | 36,25 | 40,26 | 43,77 | 47,96 |
Чем меньше q, тем больше значение c2 q (при том же числе степеней свободы v), тем легче выполняется условие c2 < c2 q и принимается проверяемая гипотеза. Не рекомендуется принимать 0,02£q£ 0,1.
4-й этап: определение доверительных границ случайной погрешности. Если удалось идентифицировать закон распределения результатов измерения, то с его использованием находят квантильный множитель tp при заданном значении доверительной вероятности Р. В этом случае доверительные границы случайной погрешности имеют вид:
. (3.8)
Обычно задаются доверительной вероятностью, равной одной из следующих величин: 0,90; 0,95; 0,99; 0,999, что соответствует значениям tp, равным 1,645; 1,96; 2,576 и 3,291.
5-й этап: запись результата измерения. Результат измерения записывается в виде х = ± Dр при доверительной вероятности Р.
При отсутствии данных о виде функции распределения, составляющих погрешности, результаты измерения представляют в виде , S, п, Θ при доверительной вероятности Р.