Глава 8. обработка результатов
ИЗМЕРЕНИЙ
Прямые многократные измерения
Равноточные измерения
Прямые многократные измерения делятся на равно- и неравноточные. Теоретические основы и методика объединения результатов неравноточных измерений подробно рассмотрены в [3]. Равно точными называются измерения, которые проводятся средствами измерений одинаковой точности по одной и той лее методике при неизменных внешних условиях. При равноточных измерениях СКО результатов всех рядов измерений равны между собой.
Перед проведением обработки результатов измерений необходимо удостовериться в том, что данные из обрабатываемой выборки статистически подконтрольны, группируются вокруг одного и того же центра и имеют одинаковую дисперсию. Устойчивость изменений часто оценивают интуитивно на основе длительных наблюдений. Однако существуют математические методы решения поставленной задачи — так называемые методы проверки однородности [3]. Применительно к измерениям рассматривается однородность групп наблюдений, необходимые признаки которой состоят в оценке несмещенности средних арифметических и дисперсий относительно друг друга.
Проверка допустимости различия между оценками дисперсий нормально распределенных результатов измерений выполняется с помощью критерия Р.Фишера при наличии двух групп наблюдений и критерия М.Бартлетта, если групп больше. Критерий Фишера рассмотрен в гл. 5.
Задача обработки результатов многократных измерений заключается в нахождении оценки измеряемой величины и доверительного интервала, в котором находится ее истинное значение. Обработка должна проводится в соответствии с ГОСТ 8.207—76 "ГСИ. Прямые измерения с многократными наблюдениями. Методы обработки результатов наблюдений. Общие положения".
Исходной информацией для обработки является ряд из n (n > 4) результатов измерений x1, х2, х.г,..., хn, из которых исключены известные систематические погрешности, — выборка. Число n зависит как от требований к точности получаемого результата, так и от реальной возможности выполнять повторные измерения.
Последовательность обработки результатов прямых многократных измерений состоит из ряда этапов.
Определение точечных оценок закона распределения результатов измерений. На этом этапе определяются:
• среднее арифметическое значение х измеряемой величины по формуле (6.8);
• СКО результата измерения Sx по формуле (6.11) или (6.12);
• СКО среднего арифметического значения Sx̅ по формуле (6.10). В соответствии с критериями, рассмотренными в гл. 7, грубые погрешности и промахи исключаются, после чего проводится повторный расчет оценок среднего арифметического значения и его СКО. В ряде случаев для более надежной идентификации закона распределения результатов измерений могут определяться другие точечные оценки: коэффициент асимметрии, эксцесс и контрэксцесс, энтропийный коэффициент.
Определение закона распределения результатов измерений или случайных погрешностей измерений. В последнем случае от выборки результатов измерений х1, х2, х3,-.., хn переходят к выборке отклонений от среднего арифметического Dх1, Dх2, Dх3,..., Dхn, где Dxi = xi - х̅.
Первым шагом при идентификации закона распределения является построение по исправленным результатам измерений xi, где I = 1, 2,..., n, вариационного ряда (упорядоченной выборки), а также уi, где уi = min(xi) и уn = mах(хi). В вариационном ряду результаты измерений (или их отклонения от среднего арифметического) располагают в порядке возрастания. Далее этот ряд разбивается на оптимальное число m, как правило, одинаковых интервалов группирования длиной h = (y1 + yn) / m .
Задача определения оптимального числа m интервалов группирования рассматривалась в ряде работ, обзор которых дан в [4]. Оптимальным является такое число интервалов m, при котором возможное максимальное сглаживание случайных флуктуации данных сопровождается с минимальным искажением от сглаживания самой кривой искомого распределения. Для практического применения целесообразно использовать предложенные в [4] выражения mmin = 0,55n0,4 и mmax =1,25n0,4, которые получены для наиболее часто встречающихся на практике распределений с эксцессом, находящимся в пределах от 1,8 до 6, т.е. от равномерного до распределения Лапласа.
Искомое значение m должно находится в пределах от mmjn до mmax, быть нечетным, так как при четном m в островершинном или двухмодальном симметричном распределении в центре гистограммы оказываются два равных по высоте столбца и середина кривой распределения искусственно уплощается. В случае, если гистограмма распределения явно двухмодальная, число столбцов может быть увеличено в 1,5-2 раза, чтобы на каждый из двух максимумов приходилось примерно по m интервалов. Полученное значение длины интервала группирования h всегда округляют в большую сторону, иначе последняя точка окажется за пределами крайнего интервала.
Далее определяют интервалы группирования экспериментальных данных в виде D1 = (у1, y1 + h); D2= (y1 +h, y1 + 2h);....; Dm = (yn - h; уn), и подсчитывают число попаданий nk (частоты) результатов измерений в каждый интервал группирования. Сумма этих чисел должна равняться числу измерений. По полученным значениям рассчитывают вероятности попадания результатов измерений (частости) в каждый из интервалов группирования по формуле pk= nk/n, где k=l, 2,..., m.
Проведенные расчеты позволяют построить гистограмму, полигон и кумулятивную кривую. Для построения гистограммы по оси результатов наблюдений х (рис. 8.1,а) откладываются интервалы Dk в порядке возрастания номеров и на каждом интервале строится прямоугольник высотой pk. Площадь, заключенная под графиком, пропорц/иональна числу наблюдений n. Иногда высоту прямоугольника откладывают разной эмпирическoй плотности вероятности pk = Pk /Dk = nk/(nDk), которая является оценкой средней плотности в интервале Dk. В этом случае площадь под гистограммой равна единице. При увеличении числа интервалов и соответственно уменьшении их длины гистограмма все более приближается к гладкой кривой — графику плотности распределения вероятности. Следует отметить, что в ряде слуяаев производят расчетное симметрирование гистограммы, методика которого приведена в [4 ]
Полигон представляет собой ломаную кривую, соединяющую середины верхних оснований каждого столбца гистограммы (см. рис. 8.1,а). Он более наглядно, чем гистограмма, отражает форму кривой распределения. За пределами гистограммы справа и слева остаются пустые интервалы, в которых точки, соответствующие их серединам, лежат на оси абсцисс.
Рис. 8.1. Гистонрамма, полигон (а) и кумулятивная кривая (б)
Эти точки при построении полигона соединяют между собой отрезками прямых линий. В результате совместно с осью х образуется замкнутая фигура, площадь которой в соответствии с правилом нормирования должна быть равна единице (или числу наблюдений при использовании частостей).
Кумулятивная кривая — это график статистической функции распределения. Для ее построения по оси результатов наблюдений х (рис. 8.1,6) откладывают интервалы Dk в порядке возрастания номеров и на каждом интервале строят прямоугольник высотой
Значение Fk называется кумулятивной частостью, а сумма nk— кумулятивной частотой.
По виду построенных зависимостей может быть оценен закон распределения результатов измерений.
Оценка закона распределения по статистическим критериям. При числе наблюдений n > 50 для идентификации закона распределения используется критерий Пирсона (хи-квадрат, см. 8.1.2) или критерий Мизеса—Смирнова (w2). При 50 > n > 15 для проверки нормальности закона распределения применяется составной критерий (d-критерий), приведенный в ГОСТ 8.207-76. При n < 15 принадлежность экспериментального распределения к нормальному не проверяется.
Определение доверительных границ случайной погрешности. Если удалось идентифицировать закон распределения результатов измерений, то с его использованием находят квантильный множитель zp при заданном значении доверительной вероятности Р. В этом случае доверительные границы случайной погрешности А = ±zpS -.
Определение границ неисключенной систематической погрешности q результата измерений. Под этими границами понимают найденные нестатистическими методами границы интервала, внутри которого находится неисключенная систематическая погрешность. Она образуется из ряда составляющих: как правило, погрешностей метода и средств измерений, а также субъективной погрешности. Границы неисключенной систематической погрешности принимаются равными пределам допускаемых основных и дополнительных погрешностей средств измерений, если их случайные составляющие пренебрежимо малы. Они суммируются по правилам, рассмотренным в разд. 9.2. Доверительная вероятность при определении границ 6 принимается равной доверительной вероятности, используемой при нахождении границ случайной погрешности.
Определение доверительных границ погрешности результата измерения Dр. Данная операция осуществляется путем суммирования СКО случайной составляющей Sx̅ и границ неисключенной систематической составляющей q в зависимости от соотношения q/ Sx̅ по правилам, изложенным в разд. 9.4.
Запись результата измерения. Результат измерения записывается в виде х = х̅ ± Dp при доверительной вероятности Р = Р . При отсутствии данных о виде функции распределения составляющих погрешности результаты измерений представляют в виде х, S-, п, 8 при доверительной вероятности Р = Рд.