Обработка результатов анализа методами математической статистики
Рассмотрим некоторые понятия и основные подходы к классификации погрешностей. По способу вычисления погрешности можно подразделить на абсолютные и относительные.
Абсолютная погрешностьравна разности среднего измерения величины х и истинного значения этой величины:
В отдельных случаях, если это необходимо, рассчитывают погрешности единичных определений:
Заметим, что измеренной величиной в химическом анализе может быть как содержание компонента, так и аналитический сигнал. В зависимости от того, завышает или занижает погрешность результат анализа, погрешности могут быть положительные и отрицательные.
Относительная погрешностьможет быть выражена в долях или процентах и обычно знака не имеет:
или
Можно классифицировать погрешности по источникам их происхождения. Так как источников погрешностей чрезвычайно много, то их классификация не может быть однозначной.
Чаще всего погрешности классифицируют по характеру причин, их вызывающих. При этом погрешности делят на систематические и случайные, выделяют также промахи (или грубые погрешности).
К систематическимотносят погрешности, которые вызваны постоянно действующей причиной, постоянны во всех измерениях или меняются по постоянно действующему закону, могут быть выявлены и устранены.
Случайныепогрешности, причины появления которых неизвестны, могут быть оценены методами математической статистики.
Промах— это погрешность, резко искажающая результат анализа и обычно легко обнаруживаемая, вызванная, как правило, небрежностью или некомпетентностью аналитика. На рис. 1.1 представлена схема, поясняющая понятия систематических и погрешностей и промахов. Прямая 1 отвечает тому идеальному случаю, когда во всех N определениях отсутствуют систематические и случайные погрешности. Линии 2 и 3 тоже идеализированные примеры химического анализа. В одном случае (прямая 2) полностью отсутствуют случайные погрешности, но все N определений имеют постоянную отрицательную систематическую погрешность Δх ; в другом случае (линия 3) полностью отсутствует систематическая погрешность. Реальную ситуацию отражает линия 4:имеются как случайные, так и систематические погрешности.
Рис. 4.2.1 Систематические и случайные погрешности химического анализа.
Деление погрешностей на систематические и случайные в известной степени условно.
Систематические погрешности одной выборки результатов при рассмотрении большего числа данных могут переходить в случайные. Например, систематическая погрешность, обусловленная неправильными показаниями прибора, при измерении аналитического сигнала на разных приборах в разных лабораториях переходит в случайную.
Воспроизводимостьхарактеризует степень близости друг к другу единичных определений, рассеяние единичных результатов относительно среднего (рис. 1.2).
Рис. 4.2..2. Воспроизводимость и правильность химического анализа
В отдельных случаях наряду с термином «воспроизводимость» используют термин «сходимость». При этом под сходимостью понимают рассеяние результатов параллельных определений, а под воспроизводимостью — рассеяние результатов, полученных разными методами, в разных лабораториях, в разное время и т. п.
Правильность— это качество химического анализа, отражающее близость к нулю систематической погрешности. Правильность характеризует отклонение полученного результата анализа от истинного значения измеряемой величины (см. рис.1.2).
Генеральная совокупность— гипотетическая совокупность всех мыслимых результатов от -∞ до +∞;
Анализ экспериментальных данных показывает, что большие по значению погрешности наблюдаются реже, чем малые. Отмечается также, что при увеличении числа наблюдений одинаковые погрешности разного знака встречаются одинаково часто. Эти и другие свойства случайных погрешностей описываются нормальным распределением или уравнением Гаусса,которое описывает плотность вероятности .
где х-значение случайной величины;
μ – генеральное среднее (математическое ожидание-постоянный параметр);
Математическое ожидание -для непрерывной случайной величины представляет собой предел, к которому стремится среднее при неограниченном увеличении выборки. Таким образом, математическое ожидание является средним значением для всей генеральной совокупности в целом, иногда его называют генеральным средним.
σ2 —дисперсия (постоянный параметр) - характеризует рассеяние случайной величины относительно своего математического ожидания;
σ – стандартное отклонение.
Дисперсия – характеризует рассеяние случайной величины относительно своего математического ожидания.
Выборочная совокупность (выборка) — реальное число (n) результатов, которое имеет исследователь , n = 3 ÷ 10.
Нормальный закон распределения неприемлем для обработки малого числа изменений выборочной совокупности (обычно 3 – 10) – даже если генеральная совокупность в целом распределена нормально. Для малых выборок вместо нормального распределения используют распределение Стьюдента (t – распределение), которое связывает между собой три основные характеристики выборочной совокупности –
-ширину доверительного интервала;
-соответствующую ему вероятность;
- объем выборочной совокупности.
Перед обработкой данных с применением методов математической статистики необходимо выявить промахи (грубые ошибки) и исключить их из числа рассматриваемых результатов. Одним из наиболее простых является метод выявления промахов с применением Q – критерия с числом измерений n < 10:
где R = хмакс - хмин – размах варьирования; х1 – подозрительно выделяющееся значение; х2 – результат единичного определения, ближайший по значению к х1.
Полученное значение сравнивают с критическим значением Qкрит при доверительной вероятности Р = 0,95. Если Q > Qкрит, выпадающий результат является промахом и его отбрасывают.
Основные характеристики выборочной совокупности. Для выборки из n результатов рассчитывают среднее, :
и дисперсию, характеризующую рассеяние результатов относительно среднего:
Дисперсия в явном виде не может быть использована для количественной характеристики рассеяния результатов, поскольку ее размерность не совпадает с размерностью результата анализа. Для характеристики рассеяния используют стандартное отклонение, S.
Эту величину называют также средним квадратичным (или квадратическим) отклонением или средней квадратичной погрешностью отдельного результата.
Относительное стандартное отклонениеили коэффициент вариации (V) вычисляют по соотношению
Дисперсию среднего арифметического вычисляют:
и стандартное отклонение среднего
Следует отметить, что все величины – дисперсия, стандартное отклонение и относительное стандартное отклонение, а так же дисперсия среднего арифметического и стандартное отклонение среднего арифметического – характеризуют воспроизводимость результатов химического анализа.
Используемое при обработке небольших (n<20) выборок из нормально распределенной генеральной совокупности t – распределение (т.е. распределение нормированной случайной величины) характеризуется соотношением
где tp,f – распределение Стьюдента при числе степеней свободы f=n-1 и доверительной вероятности Р=0,95 (или уровня значимости р=0,05).
Значения t - распределения приведены в таблицах, по ним рассчитывают для выборки в n результатов величину доверительного интервала измеряемой величины для заданной доверительной вероятности по формуле
Доверительный интервал характеризует как воспроизводимость результатов химического анализа, так и – если известно истинное значение хист – их правильность.