Элементы математической статистики
Пусть проведено измерение (многократное наблюдение) некоторой физической величины а и в результате получен ряд ее значений:
.
Эти значения в большинстве своем отличаются друг от друга. Будем считать, что это отличие вызвано присутствием только случайных погрешностей, т.е. мы имеем результаты наблюдений случайной величины.
Случайной называется величина, которая может принять то или иное значение, причем заранее неизвестно, какое именно. Случайная величина оценивается вероятностью. Согласно определению вероятностью Р какой-либо случайной величины а называется предел отношения числа случаев появления данной случайной величины Ni к общему числу всех проведенных опытов N при :
.
Вероятность принято выражать в долях единицы или в процентах. Из данного определения следует, что вероятность Р удовлетворяет неравенству .
Смысл понятия вероятности заключается в том, что на основании опыта более вероятными считают те события, которые происходят чаще, менее вероятными - те, что происходят реже.
В теории вероятности доказывается, что из всего ряда значений величины а наилучшим, т.е. наиболее близким к истинному является среднее арифметическое значение результатов наблюдений:
.
Тогда погрешности отдельных наблюдений определятся как
,
,
.......................
.
Как величины случайные, погрешности могут принимать разные значения с разной вероятностью. Описание совокупности значений случайной величины с указанием вероятности каждого значения называется законом распределения этой величины.
В практике измерений наибольшее распространение имеет нормальный закон распределения (закон Гаусса). В основе распределения Гаусса лежат два предположения:
1) при большом числе наблюдений погрешности равной величины, но разного знака встречаются одинаково часто, т.е. равновероятны;
2) вероятность появления погрешностей уменьшается с ростом величины погрешности, т.е. большие по абсолютной величине погрешности встречаются реже, чем малые. Наиболее вероятным является среднее арифметическое значение.
Кривая нормального распределения симметрична относительно среднего значения и описывается функцией Гаусса, аналитическое выражение которой имеет вид:
.
Функция распределения f(a) имеет смысл плотности вероятности: , где представляет вероятность появления отдельного случайного значения величины а в интервале значений от а до . Геометрически эта вероятность представляет собой площадь под кривой f(a), ограниченную отрезком da. Вся площадь под кривой (полная вероятность)
.
Параметр sН характеризует степень рассеяния результатов наблюдений относительно среднего значения , т.е. определяет форму кривой распределения. С увеличением sН максимальная ордината кривой Гаусса уменьшается. Поскольку площадь под кривой всегда одинакова и равна единице, то с увеличением sН кривая растягивается вдоль оси абсцисс. Разброс значений относительно увеличивается, качество измерений ухудшается.
Кривая 2 нормального распределения, представленного на рисунке, соответствует большему, а кривая 1 - меньшему значению sН, т.е. . Это означает, что в первом случае измерения проведены более качественно, чем во втором.
Значения соответствуют точкам перегиба функции f(a). Вероятность того, что случайная величина принимает значение, принадлежащее интервалу
от до , равна , или 68%
(геометрически - это заштрихованная часть площади на графике). Вероятность того, что случайная величина принимает значение, принадлежащее интервалу от до , равна (95%), а для интервала от до вычисленная вероятность составляет , или 99,7%.
Вероятность, с которой величина а заключена в интервале значений , называется доверительной вероятностью Р , а интервал носит название доверительного. Абсолютная случайная погрешность равна половине доверительного интервала.
Среднее арифметическое всегда отличается от истинного и лишь при совпадает с ним. Оно само является случайной величиной, подчиняется распределению Гаусса и характеризуется средним квадратичным отклонением результата измерения s, связанным с sН выражением:
.
При ограниченном числе наблюдений (2<N<30) коэффициент t зависит не только от доверительной вероятности P, но и от числа наблюдений N. Этот коэффициент, называется коэффициентом Стьюдента tPN, его значения приведены в табл. 1. Абсолютная случайная погрешность в этом случае рассчитывается по формуле
.
Таблица 1