Статистическая обработка результатов измерений, содержащих случайную ошибку
Обратимся к рассмотрению, пожалуй, самой трудной для усвоения задаче лабораторного практикума – обработке результатов измерений.
Обработка результатов прямых измерений
Случайные ошибки обусловливают разброс экспериментальных данных около истинного значения X. Они принципиально неустранимы, но их величину можно прогнозировать методами математической статистики по измеренным величинам x.
Продемонстрируем данный процесс на конкретном примере об определении расстояния шагами. Один из авторов этого пособия в течение многих лет ходит из дома на работу (расстояние L) с шагомером в кармане. В таблице 8.1.1 приведены записи показаний шагомера.
Таблица 8.1.1
Результаты измерения расстояния шагомером
Число шагов | Число наблюдений k в интервале шириной 10, 20 и 40 шагов | Число шагов, продол-жение | Число наблюдений k в интервале шириной 10, 20 и 40 шагов | ||||
6190 и менее | 6400-6409 | ||||||
6200-6209 | 6410-6419 | ||||||
6210-6219 | 6420-6429 | ||||||
6220-6229 | 6430-6439 | ||||||
6230-6239 | 6440-6449 | ||||||
6240-6249 | 6450-6459 | ||||||
6250-6259 | 6460-6469 | ||||||
6260-6269 | 6470-6479 | ||||||
6270-6279 | 6480-6489 | ||||||
6280-6289 | 6490-6499 | ||||||
6290-6299 | 6500-6509 | ||||||
6300-6309 | 6510-6519 | ||||||
6310-6319 | 6520-6529 | ||||||
6320-6329 | 6530-6539 | ||||||
6330-6339 | 6540-6549 | ||||||
6340-6349 | 6550-6559 | ||||||
6350-6359 | 6560-6569 | ||||||
6360-6369 | 6570-6579 | ||||||
6370-6379 | 6580-6589 | ||||||
6380-639 | 6590-6599 | ||||||
6390-6399 | 6600 и более |
Всего 2080 опытов.
Рис. 8.1.1. Измерение расстояния шагами:
а – гистограмма и кривая распределения данных таблицы 1.1.1. По горизонтальной оси отложено число шагов x, по оси ординат в удобном масштабе – число случаев k, когда отсчет попадает в рассматриваемый интервал;
б – среднее значение и доверительный интервал для 2080 измерений;
в – среднее значение, доверительный интервал и экспериментальные точки для 5 измерений
Для дальнейшего анализа удобно представить эти результаты наглядно в виде «столбчатой» диаграммы. Разобьем всю область изменения значений x (от 6200 до 6600 шагов) на равные отрезки (основания столбиков) и подсчитаем, сколько раз измеряемая величина (число шагов) попадает в каждый из интервалов. Число этих попаданий отложим в произвольном масштабе на оси ординат (высота столбов). Такие диаграммы называются гистограммами (histos - столб). Ширина интервалов может быть любой: на рисунке 8.1.1 приведены три вложенные одна в другую гистограммы с шириной интервала в 40, 20 и 10 шагов, соответственно. Масштаб по оси абсцисс один и тот же, а по оси ординат масштабы выбраны так, чтобы максимумы всех гистограмм имели одинаковую высоту.
Отметим, что все три гистограммы имеют практически одинаковый вид: «максимумы», «точки перегиба» и «хвосты» лежат в одних и тех же областях. Отличие этих гистограмм заключается только в ширине «уступов». Если бы мы провели не 2080 измерений, а в 10 раз больше, можно было бы еще уменьшить интервалы. При этом гистограмма «выродилась» бы в практически гладкую кривую. Такие кривые, получаемые при бесконечном увеличении числа измерений и бесконечном уменьшении интервалов, называются кривыми распределения. Они изучаются в математической статистике.
Распределение Гаусса
Мы будем пользоваться только распределением Гаусса [1, с. 26], представленным на рисунке 8.1.1 кривой 4
, | (8.2.1) |
где | |
(8.2.2) | |
Эта формула распределения вполне приемлема и позволяет легко провести вычисления. Кроме того, оценки ошибок в большинстве случаев оказываются довольно грубыми, и эта неопределенность в их оценке полностью перекрывает ошибки, которые обусловлены произволом выбора в качестве функции распределения формулы (8.2.1). Правда, сказанное выше выполняется не всегда. Например, если результаты измерений дискретны и соответствуют ближайшим делениям шкалы прибора, пользоваться гауссовым распределением нельзя.
Перечислим основные свойства распределения Гаусса:
· Функция f(x) зеркально симметрична относительно истинного значения X измеряемой величины x.
· Площадь под кривой f(x) пропорциональна общему числу измерений. Коэффициент пропорциональности принято выбирать так, чтобы эта площадь равнялась 1; тогда
(8.2.3) | |
· Точки перегиба кривой (8.2.1) удалены от X на ± σ. При этом доля результатов всех измерений, попадающая в интервал (- σ, + σ), составляет 68.3 %. В интервале (- 2σ, + 2σ) находится уже 95.4 % всех результатов. В теории вероятности σ называется средним квадратичным отклонением, а σ2 – дисперсией, характеризующей разброс случайной величины (dispersio - рассеяние).
· Функция f(x)называется плотностью распределения и равна числу отсчетов, приходящихся на единичный интервал, так что f(x)dx равно числу попаданий измеряемой величины X в интервал от x до x + dx.
Метод Стьюдента
Наша задача состоит в том, чтобы, не выполняя большого числа измерений, найти среднее значение <x>, близкое к истинному значению X измеряемой величины, и погрешность измерений - полуширину доверительного интервала Dx, близкую к 2σ, как того требуют Государственные стандарты [2, 3]. Это делается по формулам Стьюдента (У. Госсет, Англия, 1908; Student – его псевдоним). Рекомендуется в качестве истинного значения X брать <x>, вычисляемое по формуле (5.2.1), а случайную ошибку оценивать по формуле
(8.3.1) | |
где n – число измерений.
Коэффициенты Стьюдента tp,n зависят от значения надежности p и числа измерений n. Величины этих коэффициентов для заданного p = 0.95 [2, 3] и различных n находят по таблице 1.1.1.
Проиллюстрируем эффективность методики Стьюдента при определении среднего значения и доверительного интервала по данным небольшого количества измерений на нашем примере с подсчетом числа шагов.
Для всей серии из n = 2080 испытаний (таблица 8.1.1) коэффициент Стьюдента tp,n равен 2, и после весьма трудоемких вычислений по формулам (5.2.1) и (8.3.1) получаем следующее выражение:
X = (6410 ± 150) шагов | (p = 0.95). | (8.3.2) |
Однако приведенный результат не является окончательным. В соответствии с излагаемыми далее – в параграфе 9.1 – правилами округления экспериментальных данных, предписывающими, сколько значащих цифр следует оставлять при оценке погрешности, выражение (8.3.2) следует записать в виде (9.1.2):
X = (6.41 ± 0.15)∙103 шагов | (p = 0.95). | |
Возвратимся к нашему примеру об измерении расстояния шагами. Для сопоставления результатов обработки большого числа измерений (8.3.2) с гистограммами и кривой распределения удобно отметить эти данные на числовой оси (рисунок 8.1.1, б) в том же масштабе, что и на рисунке 8.1.1, а. Среднее значение (5.2.1) покажем вертикальной черточкой, а доверительный интервал (8.3.1) – круглыми скобками. Из рисунка 8.1.1 видно, что, поскольку расчеты выполнены по очень большому количеству измерений, <x> действительно совпадает с абсциссой максимума кривой распределения, а границы доверительного интервала удалены от максимума вдвое дальше точек перегиба.
Если теперь из всей серии в 2080 испытаний произвольно, скажем, с помощью генератора случайных чисел, выбрать всего 5 значений x, получится приблизительно такой же результат. Пусть, например, выбраны числа x1 = 6251, x2 = 6368, x3 = 6583, x4 = 6483, x5 = 6505. После обработки по Стьюденту получим
X = (6438 ± 163) (6.41 ± 0.16)∙103 шагов | (p = 0.95). | (8.3.3) |
Отметим эти данные, а также выбранные числа на оси x рисунка 8.1.1, в. Сравнивая выражения (1.1.6 – 1.1.8) и рисунки 8.1.1, а - 8.1.1, в, убеждаемся, что метод Стьюдента позволяет с весьма неплохой точностью находить интересующие нас величины по коротким сериям испытаний. Некоторое расхождение результатов вполне допустимо, особенно если вспомнить об экономии времени и усилий на измерения и обработку при сокращении количества опытов – в нашем примере с 2080 до 5!