В соответствии с (45) имеем
t = (0.008/0.09)×[(20´13)/13]1/2 = 0.25
Полученное значение t нужно сравнить с ta,n для выбранного уровня значимости; n взять равным n1+ n2 – 1. Если принять уровень значимости 0.05, то ta,n находим по табл.III для a = 0.95 и n = 32; t32,0.95 = 2.0.
Мы видим, что t32,0.95 > t. Отсюда следует, что результаты двух серий анализов значимо не различаются. Если ta,n < t , то результаты <x>1 и <x>2 не случайно отличны друг от друга.
Для оценки расхождения между среднимиможно воспользоваться также критерием Романовского [28]. Для этого напишем выражение
R = t/St.
Средняя квадратическая погрешность величины t – St зависит только от числа наблюдений n1 и n2. Она определяется по соотношению
St = [(n1 + n2 – 2)/(n1 + n2 – 4)]1/2
Если R > 3, то расхождения <x>1 –<x>2 значимы. При R < 3 – расхождения можно считать случайными.
В таком виде критерий Романовского соответствует уровню значимости около 0.003. В рассмотренном примере t = 0.2 t = 0.25/(31/29) = 0.24 << 3. Следовательно, расхождение между средними случайно, и результаты анализа, полученные обоими лаборантами, совместны, то есть принадлежат одной совокупности.
Если для обоих рядов измерений нам известны значения генеральных дисперсий s12 и s22, то значимость расхождений определяется совсем просто. Находим дисперсию разности (<x>1 – <x>2), то есть s2:
s2 = s12/n1 + s22/n2.
Пусть |<x>1 – <x>2| = k×s. Если k больше 2 или 3 (соответственно уровень значимости 0.05 или 0.003), то следует признать наличие (вернее, достаточно большую вероятность) неслучайного расхождения. Если k меньше 2, то <x>1 и <x>2 значимо не различаются.
Насколько важно может быть определение существенности расхождений между средними, иллюстрируется историческим примером, который приведен А.К. Митропольским [11]. При сравнении Рэлеем плотности азота, полученного из воздуха путем отделения от него кислорода, CO2 и водяных паров, с плотностью азота, выделяемого из азотистых соединений, оказалось, что плотность воздушного азота примерно на 0.5% больше плотности химически связанного азота. Статистический анализ (проведенный, правда, значительно позже работы Рэлея) показал значимое различие между этими плотностями. На основании разницы в плотности Рэлей предсказал и доказал существование аргона.
10. ОПРЕДЕЛЕНИЕ ГРУБЫХ ПОГРЕШНОСТЕЙ
Вопрос о принадлежности результатов i-го измерения к данному ряду решается на основании того, что большие случайные погрешности менее вероятны», чем малые, и результат измерения, содержащий погрешность столь большую, что вероятность ее появления в данном ряду практически равна нулю, следует отбросить, как заведомо ошибочный. Вопрос о том, какую вероятность следует считать равной нулю, решается по тем же соображениям, которые были изложены выше.
Приведем пример использования этого правила. Возьмем ряд измерений длины (табл. 6). По данным табл. 6 находим среднее арифметическое <x> = 257.17, если учитывать все результаты, в том числе первого и десятого измерений. Но результат десятого измерения 266.0 – явный промах: вместо 5 записано 6. Если его отбросить, то <x> = 256.54. Однако в этом ряду 'подозрителен также и результат 258.5 (возможно, что записано 8 вместо 6). Если отбросить и его, то получится среднее арифметическое <x> = 256.30. Нетрудно понять, что такой метод отбрасывания результатов, которые кажутся нам слишком сильно выпадающими из других измерений, порочен.
Таблица 6. Результаты измерения длины
Номер измерения | l | Номер измерения | l |
258.5 | 256.0 | ||
2. | 255.4 | 266.0 | |
256.6 | 256.3 | ||
256.7 | 256.5 | ||
257.0 | 256.0 | ||
G | 256.5 | 256.3 | |
256.7 | 256.8 | ||
256.3 |
Таким способом легко получить завышенную и совершенно фиктивную точность измерений. Действительно, значение S с учетом всех приведенных в табл. 6 значений получается равным 2.5. Если отбросим два измерения – № 1 и №10, то S окажется равным 0.4. Идя по этому пути, можно отбросить также измерения № 2, 5 и 15, тогда <x> = 256.39 и S окажется равным всего 0.26. Очевидно, что такая малая погрешность появилась только как результат незаконного отбрасывания не понравившихся нам результатов измерений. Поэтому следует объективно оценить, является ли данное измерение промахом или же результатом случайного, но совершенно закономерного отклонения.
Если нам известно точное значение s, то вероятность появления значения, уклоняющегося от среднего арифметического более чем на 3s, равна 0.003, и все измерения, отличающиеся от <x>на эту (или большую) величину, могут быть отброшены как очень маловероятные. Иначе говоря, мы считаем, что результаты, вероятность получения которых меньше 0.003, могут появиться только как следствие грубой погрешности (промаха). Отбрасывая такие значения, нужно помнить, что существует очень малая, но отличная от нуля вероятность того, что отброшенное значение является не промахом, а естественным статистическим отклонением. Однако если такой маловероятный случай и произойдет, то есть будет неправильно отброшен один из результатов измерений, то практически это обычно не приведет к существенному ухудшению оценки результатов измерений.
Следует иметь в виду, что для совокупности измерений вероятность появления результата, отличающегося на величину более 3s от среднего значения, всегда больше 0.003.
Действительно, вероятность того, что результат первого измерения не будет отличаться от истинного значения более чем на 3s, составляет 1 – 0.003 = 0.997.
Вероятность того, что это же будет иметь место для второго измерения, также равна 1 – 0.003.
А вероятность того, что и первое, и второе измерения не выйдут за указанный предел, будет, согласно правилу умножения вероятностей, равна (1– 0.003)2.
Соответственно вероятность b того, что ни один из результатов n измерений не будет отличаться от среднего более чем на 3s, равна
b = (1 – 0.003)n.
Для не слишком больших n можно приближенно положить
(1–0.003)n » 1 – 0.003×n.
Сказанное означает, что вероятность того, что из 10 измерений хотя бы одно будет случайно отличаться от среднего более чем на 3s, равна уже не 0.003, а 0.03.
А при 100 измерениях вероятность такого события составит около 0.26.
Обычно число производимых измерений не очень велико. Сравнительно редко оно превышает 10¸20. При этом точное значение s неизвестно и мы можем определить лишь его оценку nS. Следовательно, отбрасывать результаты, отличающиеся от среднего более чем на 3ns мы не можем, так как не знаем, насколько значимо они отличаются от среднего. Поэтому следует воспользоваться табл.VI, помещенной в Приложении, с помощью которой легко решить вопрос об отбрасывании подозрительных результатов. Она составлена для n < 25, при n > 25 можно положить nS = s и оценку b делать, пользуясь нормальным распределением (табл.II).
Для применения табл.VI мы вычисляем среднее арифметическое <x> и среднюю квадратическую погрешность nS из всех измерений, включая подозреваемое xk, которое, на наш взгляд, недопустимо велико или мало.
Вычисляем относительное уклонение этого измерения от среднего арифметического, выраженное в долях средней квадратической погрешности:
vmax = [<x> – xk |/nS]×[n/(n – 1)]1/2. (46)
По табл.VI находим, какой вероятности b соответствует полученное значение vmax. Разумеется, следует договориться, при каких значениях b мы будем отбрасывать измерения.
Табл.VI составлена так, что наименьшее помещенное в ней значение b равно 0.01. Оставлять результаты, вероятность появления которых меньше этой величины, обычно нецелесообразно.
Следует иметь в виду, что если мы в отдельных случаях и примем естественное случайное отклонение за промах и „неправильно” выбросим такой результат, то это обычно не приведет к заметному изменению оценок измеряемой величины. Важно не выбрасывать „по интуиции”, не пользуясь вполне определенными критериями.
В нашем примере l10 = 266.0, vmax получается равным
(15/14)1/2´(266.0 – 257.2)/2.5 = 3.64.
Наибольшее значение vmax для n = 15, приведенное в табл.VI, равно 2.80, чему соответствует b = 0.01. Так как с ростом vmax соответствующее значение b уменьшается, то при vmax = 3.38 значение b должно быть намного меньше 0.01. Такие b отсутствуют в таблице. Из того, что b << 0.01, следует, что результат 266.0 надо отбросить, считая его промахом.
В оставшемся ряду представляется также подозрительным результат 258.5. Для него vmax получается равным (14 /13)1/2´(258.5 –256.5)/2 » 1. Из табл.VI видно, что этому значению соответствует b > 0.1, и результат 258.5, разумеется, нужно оставить.
Рассмотрим еще один пример. Среднее значение плотности ртути d определенное из 15 наблюдений, равно 13.59504 г/см3; средняя квадратическая погрешность 15S = 5×10–5 г/см3.
В ряду наблюдений имеется один результат: d = 13.59517 г/см3.
Для него vmax = [(13.50517–13.59504)/5×10–5]×(15/14)1/2
Для n = 15 этому значению vmax соответствует уровень значимости около 0.025.
Таким образом, выбрасывая измерение d = 13.591517, мы можем утверждать с вероятностью 0.075, что поступаем правильно, считая его промахом.
Бели все же оставить это наблюдение в общем ряду, то легко видеть, что оно изменит среднее значение d на 0.00001, то есть на число, малое по сравнению с 15S и не играющее поэтому никакой практической роли. Следовательно, решая вопрос об отбрасывании выскакивающего измерения, полезно посмотреть, как сильно оно меняет окончательный результат.
Бели вероятность появления данного измерения в ряду лежит в промежутке 0.1¸0.01, то представляется одинаково правильным – оставить это измерение или отбросить. В случаях же, когда она выхолит за указанные пределы, вопрос об отбрасывании, по-видимому, решается однозначно.
Разумеется, если мы отбрасываем какое-то измерение, то <x> и nS следует пересчитать заново – без учета исключенного результата измерений.
11. ПОГРЕШНОСТИ КОСВЕННЫХ ИЗМЕРЕНИЙ
В большинстве случаев измеряется не непосредственно интересующая нас величина, а другая, зависящая от нее тем или иным образом. Например, для измерения площади прямоугольника мы измеряем длину двух его сторон a и b а площадь S вычисляем, пользуясь соотношением S = ab.
При таких измерениях, называющихся косвенными (в отличие от прямых, при которых нужная величина измеряется непосредственно), необходимо также уметь вычислять погрешности измерений.
Здесь могут быть два основных случая:
1) интересующая нас величина зависит от одной измеряемой величины;
2) интересующая нас величина зависит от нескольких измеряемых величин.
Общие правила вычисления погрешностей для обоих случаев могут быть легко выведены с помощью дифференциального исчисления. Вначале мы ограничимся простыми частными задачами.
1. Пусть зависимость интересующей нас величины Y от измеряемой величины X имеет наиболее простой вид
Y = AX + В . (47)
Здесь А и В – постоянные, значения которых точно известны. Если X увеличить или уменьшить на некоторое число DX, то Y соответственно изменится на A×DX. Действительно, зададим X приращение DX..