Сравнительный анализ массивов
При проведении межлабораторных испытаний возникает специфическая модель измерений, называемая гнездовой структурой [3]. Особенностью этих измерений является то, что они проводятся в разное время, разными средствами измерений, в разных условиях, разными методами, разными операторами.
При этом образуется несколько групп прямых измерений с многократными наблюдениями, которые для уменьшения неопределенности следует объединять, получая единый результат измерения. Ввиду того, что неопределенности (дисперсии) наблюдений в каждой из групп имеют различное значение, определение суммарной неопределенности объединенного результата измерений необходимо проводить с учетом математического аппарата, называемого дисперсионным анализом. Методы дисперсионного анализа широко применяются при обработке результатов межлабораторных испытаний. Такие испытания подразумевают участие ряда независимых, одинаково компетентных лабораторий, проводящих несколько групп прямых измерений. Обычно предполагается, что расхождения между отдельными результатами как внутри одной лаборатории, так и между лабораториями, являются статистическими по природе, независимо от причин их вызывающих. В этом случае каждое лабораторное среднее значение является несмещенной оценкой результата измерения, а наилучшей оценкой результата объединенных наблюдений считают обычно среднее лабораторных средних значений.
Сходимость результатов измерений (сходимость измерений) – близость друг к другу результатов измерений одной и той же величины, выполненных повторно одними и теми же средствами, одним и тем же методом в одинаковых условиях и с одинаковой тщательностью.
Примечание — Сходимость измерений двух групп многократных измерений может характеризоваться размахом, средней квадратической или средней арифметической погрешностью.
Воспроизводимость результатов измерений (воспроизводимость измерений) – близость результатов измерений одной и той же величины, полученных в разных местах, разными методами, разными средствами, разными операторами, в разное время, но приведенных к одним и тем же условиям измерений (температуре, давлению, влажности и др.).
Воспроизводимость можно оценить, например, после выполнения нескольких серий многократных измерений одной и той же физической величины с использованием разных методик выполнения измерений. В качестве оценок воспроизводимости могут служить разности средних значений в сериях, средних квадратических погрешностей серий, разности экстремальных результатов разных серий и другие оценки.
В общем случае, при межлабораторных испытаниях, измерения проводятся I лабораториями, каждая из которых производит J групп измерений, причем каждая группа состоит из К независимых повторных наблюдений. Таким образом, общее число измерений равно IJK , а общее число групп наблюдений равно IJ. Это пример уравновешенной двухэтапной гнездовой структуры,для которой существует два уровня гнездования наблюдений с двумя различными факторами — день измерения и лаборатория. Структура является уравновешенной, так как каждый образец наблюдается одинаковое число раз (К) в каждой лаборатории, и каждая лаборатория имеет одинаковое число образцов (J). Целью анализа данных в этом случае является исследование возможного существования межгрупповых и межлабораторных эффектов и определение соответствующей неопределенности, которую можно приписать наилучшей оценке результата объединенных измерений. В соответствии с предыдущим примером предполагается, что эта оценка является средним из J лабораторных средних значений, которая также является средним значением IJK наблюдений.
Гнездовые структуры и анализ результатов методами дисперсионного анализа можно с успехом использовать во многих практических измерительных ситуациях. Тем не менее, многократное измерение всех входных величин редко является возможным из-за больших временных и материальных затрат, сопутствующих таким измерениям. В большинстве практических измерительных ситуациях можно оценить только несколько составляющих неопределенности, используя методы дисперсионного анализа. Поэтому, как указывалось ранее, большинство составляющих неопределенности должны оцениваться из совокупности имеющейся (априорной) информации о возможной изменчивости входных величин (по типу В).
При обработке нескольких групп наблюдений необходимо учитывать количество факторов и уравновешенность гнездовой структуры.
Уравновешенной гнездовой структурой называется структура с одинаковым количеством наблюдений в группах. Неуравновешенная структура состоит из групп с разным числом наблюдений.
Количество факторов определяется числом уровней «гнездования». Под фактором понимают различие в условиях проведения групп наблюдений. Им может быть день, в который проводились измерения, прибор или метод измерений, оператор, место проведения измерений и т.д.
Рассмотрим наиболее часто встречающуюся на практике простейшую модель уравновешенной одноэтапной гнездовой структуры.
Пусть имеется J групп прямых многократных наблюдений величины Y по К наблюдений в каждой группе. Алгоритм обработки результатов этих наблюдений заключается в следующем.
1. Определить средние арифметические каждой группы наблюдений:
, (5)
где yjk обозначает k- е наблюдение величины Y (k =1, 2,..., К) в j-й группе (j =1,2,., J);
2. Определить среднее арифметическое полученных средних арифметических , принимаемое за наилучшую оценку измеряемой величины Y:
(6)
3. Вычислить оценку внутригрупповой дисперсии в у - ой группе (число таких дисперсий равно числу групп J):
(7)
4. Найти экспериментальную дисперсию средних арифметических групп
(8)
Такая оценка только одна.
5. Определить, является ли межгрупповая составляющая дисперсии значительной по сравнению с внутригрупповой составляющей. Для этого выполняют следующие операции.
5.1. Определить две независимые оценки усредненной внутригрупповой дисперсии наблюдений.
Первая оценка, обозначенная как , получается из наблюдаемых отклонений средних арифметических (5). Поскольку есть среднее арифметическое К наблюдений, его оцененная дисперсия при допущении, что межгрупповая дисперсия равна нулю, оценивается как . Тогда из уравнения (7) следует
(9)
Эта оценка имеет (J - 1) степеней свободы.
Вторая оценка, обозначенная как , является средней оценкой дисперсии, полученной из J индивидуальных значений внутригрупповой дисперсии :
= (10)
Поскольку структура уравновешенная и все степени свободы nj = К - 1, то получающееся в результате выражение для есть просто среднее арифметическое :
(11)
Таким образом, с учетом выражения (7) получают
, (12)
что является оценкой, имеющей J(К -1) степеней свободы.
Поскольку оценка основывается на изменчивости средних арифметических, в то время как оценка основывается на изменчивости внутригрупповых наблюдений, их отличие показывает возможное присутствие межгрупповой изменчивости.
5.2. Сравнивают значения и . Для этого используют F-тест.
Известно, что F-распределение составляющих является распределением вероятностей отношения
F( = (13)
двух независимых оценок и дисперсии нормально распределенной случайной переменной. Параметры и являются соответствующими степенями свободы двух оценок, а 0 £ F( < ¥. Критические значения F для различных вероятностей (квантили F — распределения) внесены в таблицу распределения Фишера для разных значений и (см. табл. Б.2).
Обычно критические значения F задаются для вероятностей 0,95, 0,975 или 0,99. Если рассчитанное значение F( больше, чем критическое для заданной вероятности (F0,95 > F0,975 или F0,99), то это истолковывается как наличие межгрупповой дисперсии, поскольку больше на статистически значимую величину.
6. При F( < Fр существование межгрупповой погрешности отрицается, так как разница между и не рассматривается как статистически значимая, оцененную дисперсию для следует считать из общего выражения
7. При F( ≥ Fр существование межгрупповой дисперсии принимается (разумное решение, так как оно позволяет избежать возможной недооценки неопределенности) и предполагается, что она случайна. Тогда оцененная дисперсия получается из , так как она должным образом отражает как внутригрупповую, так межгрупповую случайные составляющие дисперсии. Таким образом,
(14)
и с учетом уравнения (8) получаем
(15)
Эта оценка дисперсии имеет J - 1 степеней свободы.