Математическое описание случайных погрешностей.
Измеряемая величина, содержащая случайную погрешность, должна рассматриваться как случайная величина. Из теории вероятностей известно, что наиболее полно случайные величины характеризуются законами распределения вероятностей.
Плотность распределения вероятностей
, (1.13)
где F(x)– вероятность значений случайной величины х в интервале dx.
Наряду с плотностью распределения вероятностей используется функция распределения вероятностей случайной величины
, (1.14)
которая выражает собой вероятность того, что случайная величина находится в интервале от -¥ до x1 . Функция распределения любой случайной величины является неубывающей функцией, определенной так, что F(-¥)=0, а F(+¥) = 1 . Вероятность того, что случайная величина X примет значение в интервале между x1 и x2 , равна
(1.15)
В разнообразных измерительных устройствах законы распределения вероятностей различны. Преимущественно встречаются нормальные и равномерные распределения. Случайная величина X распределена нормально, если её плотность вероятностей имеет вид
(1.16).
где s - среднее квадратическое отклонение, m=M[Х];
m - математическое ожидание.
Математическое ожидание M[X] случайной величины X является постоянной величиной и характеризует её среднее значение. Величина является случайной погрешностью. Если систематическая погрешность отсутствует, то математическое ожидание равно истинному значению величины X.
На рис. I.I, а показана дифференциальная функция нормального распределения f(x). Рассеяние результатов вокруг M[х] уменьшаетcя с уменьшением s. При расчетах пользуются нормированным нормальным распределением, когда нормируется случайная величина:
(1.17)
где нормированная случайная величина. Интеграл
(1.18)
Рис.1.1,а
выражает вероятность попадания случайной погрешности в интервал 0–t1 и носит название функции Лапласа. Значения f(t) и Р(t1) приводятся в табл. I и 2 приложения. Из табл. 2 приложения можно найти, что вероятность появления случайной погрешности в интервалах ±t1 = = ± 1 ; ±2 ; ± 3 c учетом симметричности распределения равна соответственно 0,683, 0,954, 0,997. Эти цифры характеризуют вероятность появления случайной погрешности в интервалах ±s'; ±2s;'±3s. Если случайные погрешности определяются по результатам измерений, то в большинстве случаев они имеют нормальное распределение.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Вероятность появления погрешности в интервале x4-x3 равна
Равномерное распределение имеет погрешность квантования измеряемой величины по уровню в цифровых измерительных приборах.
Если закон распределения неизвестен, то всегда принимают равномерное распределение.
В измерительной практике встречаются и другие законы распределения, которыми в [6] рекомендуется аппроксимировать реальные законы распределений: треугольный, трапециевидный, антимодальные I и II, Рэлея.
Для решения многих задач не требуется знание функции и плотности распределения вероятностей, а вполне достаточными характеристиками случайных погрешностей служат их числовые характеристики: математическое ожидание (первый начальный момент)
(I.20)
и дисперсия (второй центральный момент)
(1.21)
Корень квадратный из дисперсии, взятый с положительным знаком, есть среднее квадратическое отклонение случайной величины .
Математическое ожидание является центром группирования случайной величины, а дисперсия характеризует мощность рассеяния.
Нормальное распределение полностью характеризуется математическим ожиданием и дисперсией.
Равномерное распределение (рис I.I,б) тоже определяется двумя параметрами M[x]и xт .
Дисперсия равномерного распределения
(1.22)
а среднее квадратическое отклонение
Вероятность появления случайной погрешности в интервале ±s составляет р=s/xm=0.578 .
Числовые вероятностные характеристики погрешностей, представляющие собой неслучайные величины, теоретически определяются при бесконечном числе наблюдений. Практически число наблюдений n всегда ограничено. Поэтому реально пользуются статистическими числовыми характеристиками, которые принимают за искомые вероятностные характеристики и называют оценками характеристик. Чтобы подчеркнуть различие между формулами вероятностных характеристик и их оценок, последние отмечают знаком ~.
К оценкам случайной величины, получаемым по статистическим данным, предъявляются требования состоятельности, несмещенности и эффективности.
Оценка параметра Q считается состоятельной, если при увеличении числа наблюдений она стремится к истинному значению оцениваемой величины :
Несмещенной она называется в том случае, если математическое ожидание её равно истинному значению оцениваемой величины: .
Чем меньше дисперсия оценки, тем более эффективной ее называют .
Обычно для симметричных распределений в качестве оценки математического ожидания ряда равноточных наблюдений принимают среднее арифметическое ряда наблюдений п:
(1.23)
где qi - результат i наблюдения; п - число наблюдений.
Если отсутствует систематическая погрешность, то при .
Разность представляет собой случайную погрешность при i -м наблюдении. Она может быть как положительной, так и отрицательной.
Среднее арифметическое, независимо от закона распределения, обладает следующими свойствами:
(I.24)
(1.25)
Первое свойство используется для проверки правильности вычисления , а второе положено в основу метода наименьших квадратов.
В качестве оценки дисперсии берётся дисперсия отклонения результата наблюдения
, (1.26)
а оценки среднего квадратического отклонения
. (1.27)
Формула (1.27) характеризует среднее квадратическое отклонение отдельного наблюдения.
Для вычислений абсолютной погрешности требуется найти разность между результатом наблюдения Qi и истинным значением измеряемой величины Qист. Но Qист никогда неизвестно, поэтому, как уже отмечалось, на практике пользуются действительным значением измеряемой величины. При достаточно большом числе наблюдений, не искаженных систематической погрешностью, в качестве действительного значения можно принять среднее арифметическое результатов наблюдений и принять его за результат измерения.
Среднее арифметическое зависит от числа наблюдений и является случайной величиной с некоторой дисперсией относительно истинного значения величины Qист , т.е. величину можно рассматривать как оценку Qист , т.е. .
В теории вероятностей показывается, что оценкой дисперсии среднего арифметического ряда наблюдений относительно истинного значения является
(1.28)
Величину называют средним квадратическим отклонением результата измерений.
Следовательно, взяв за результат измерения , уменьшаем среднее квадратическое отклонение в раз по сравнению со случаем, когда за результат измерения принимается любое одно из п наблюдений. Из полученных выражений видно, что многократные измерения с последующим усреднением результатов позволяют уменьшить случайную составляющую погрешности, а также оценить её.
Доверительный интервал.
Рассмотренные оценки результатов измерений называют точечными. Они указывают интервал значений измеряемой величины, внутри которого находится истинное значение , Поскольку и величины случайные, то возникает вопрос о точности и надежности полученной оценки. Судят об этом по вероятности того, что абсолютное значение отклонения будет оставаться меньше некоторой величины
(1.29)
или
(1.30)
Величина e характеризует точность оценки, а вероятность р , называемая доверительной вероятностью и коэффициентом доверия, – надёжность оценки.
Зависимость (1.30) , записанная в виде
(1.31)
говорит о том, что случайный интервал J(p)=2e, находящийся в пределах от , с вероятностью р накрывает величину Qист (или неслучайная величина Qист с вероятностью p оказывается внутри этого интервала). Интервал J(р) называют доверительным интервалом, а его границы доверительными.
Используя интервальную оценку результатов измерений, необходимо задавать доверительный интервал и доверительную вероятность. Если закон распределения вероятностей случайных погрешностей известен, то выбор одной из указанных величин определяет вторую. Это видно из следующего. После подстановки в (1.29) нормированных величин t = D/s и tp=e/s можно записать известное из теории вероятностей равенство
(1.32)
Следовательно, (1.33) и при известной функции распределения F(t) конкретное значение р
определяет значение tp и наоборот.
В случае нормального распределения и числа наблюдений п³20 tp выбирается по таблице функций Лапласа (см. табл. 2 приложения), при этом значение вероятности умножается на 2, так как в таблице они приведены для половины симметричного интервала.
Если число наблюдений п £20, доверительный интервал случайной погрешности при заданных вероятности р и средним квадратическим отклонением результата измерения определяется по формуле Стьюдента
(1.34)
где t p ,n - коэффициент распределения Стьюдента, который зависит от заданной вероятности p и числа наблюдений п (табл.3 приложения). При п>20 распределение Стьюдента приближается к нормальному и вместо t p ,n можно использовать t p для нормального распределения.
При равномерном распределении обычно принимают (т.е. для p=1), поскольку доверительный интервал слабо зависит от доверительной вероятности.
Как правило, в практике измерений доверительную вероятность принимают р = 0.95. Если измерения нельзя повторить, то р=0.99. В особо ответственных случаях, когда проводимые измерения связаны с созданием новых эталонов или от них зависит здоровье людей, то p= 0.997 и выше.
При нормальном законе распределений погрешностей доверительная вероятность р=0.68 соответствует доверительному интервалу
При оценке погрешностей, как уже указывалось, очень важно знать их закон распределения. Из теории вероятностей известно, если имеется большое число наблюдений (п³30 ), то оказывается возможным проверить гипотезу относительно закона распределения. Гипотеза может быть высказана на основе построения гистограммы. Для проверки соответствия гипотезы экспериментальному распределению существует ряд критериев. Наиболее распространенным является критерий Пирсона, или критерий c2(«хи - квадрат»), который позволяет проверить соответствие экспериментальных данных любому распределению, а не только нормальному.
Схема обработки результатов измерения с многократными наблюдениями приведена на рис.1.2.