Сравнение двух рядов наблюдений
При проведении и анализе результатов экспериментальных исследований часто приходится сравнивать две партии изделий, показания двух или нескольких приборов, анализировать результаты работы однотипных агрегатов, сравнивать результаты исследований двух проб материалов и т.д. Вот некоторые примеры подобных ситуаций.
1. Необходимо сравнить показания двух приборов, измеряющих одну и ту же величину, когда этими рабочими средствами измерений получено два ряда наблюдений данной величины. Одинакова ли точность измерения одного и того же технологического параметра разными приборами?
2. Требуется поверить рабочее средство измерения (т.е. определить, не выходят ли погрешности его измерений за пределы регламентированных значений) с помощью образцового средства измерения. Равно ли математическое ожидание показаний данного прибора действительному значению измеряемого параметра?
3. Два агрегата выпускают одну и ту же продукцию. Необходимо сделать вывод о том, какой из них лучше или хуже в каком-либо смысле.
Решение подобных задач осуществляется также с использованием аппарата проверки статистических гипотез. Ведь если нам необходимо было бы сравнить две случайные величины X и У, имеющие нормальное распределение, при известных их математических ожиданиях и дисперсиях Мх; ох2 и Му; оу2, то вопрос, очевидно, решался бы достаточно просто. Две случайные вели-
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
чины с нормальным распределением равны между собой (имеют одинаковое распределение, т.е. имеют одну и ту же функцию распределения F(X) = F(Y) или плотность распределения f(X) = f(Y)), когда равны между собой их математические ожидания (Мх = Му) и дисперсии (ох2 = оу2), поскольку только эти два параметра полностью определяют нормальное (двухпараметрическое) распределение (см. (2.12) или (2.21)).
Однако, как это уже неоднократно ранее отмечалось, любой из параметров распределения случайной величины 0 может быть найден лишь по всей генеральной совокупности, т.е. только теоретически при проведении бесконечно большого количества опытов. Практически, по выборке ограниченного объема, исследователь может определить только приближенное значение параметра - его оценку 0*. При этом вероятность того, что оценка 0* совпадет со значением оцениваемого параметра 0, очень мала. Следовательно, даже если равны между собой параметры распределений двух случайных величин (0Х = 0У), то их оценки скорее всего не будут одинаковыми (0Х* ф 0у*).
Поэтому при сравнении двух случайных величин обычно приходится высказывать и проверять нулевую гипотезу Н0: 0Х = 0У, при альтернативных гипотезах типа Н-|(1): 0Х < 0У или Н/2): 0Х > 0У. Н/3): 0Х ф 0у,
Сравнение двух дисперсий
При выполнении измерений в различных условиях часто возникает задача сравнения степени разброса (дисперсий) исследуемых параметров (случайных величин).
Проверка гипотезы о равенстве дисперсий имеет большое значение, так как измеряемая дисперсией величина рассеяния характеризует такие исключительно важные показатели, как точность машин, приборов, стабильность технологических процессов, качество готовой продукции и т.д. Поэтому, например, о преимуществах той или иной технологии или о качестве выпускаемой продукции вывод можно часто сделать в результате сравнения дисперсий тех параметров, которые их характеризуют.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Таким образом, требуется установить, являются ли выборочные дисперсии S2 ф S22 со степенями свободы ггн и т2 значимо отличающимися или же они характеризуют выборки, взятые из одной и той же генеральной совокупно-
сти или из генеральных совокупностей с равными дисперсиями (<л
а2
= а2).
В этом случае нулевая гипотеза формулируется в виде Н0: о2 = а22= а2 , т.е. между двумя генеральными дисперсиями различия нет при заданном уровне значимости а.
Для проверки этой гипотезы используется критерий, основанный на распределении Фишера, зависящем только от числа степеней свободы ггн и т2. Аналитическое выражение критерия Фишера имеет вид
2 2 |
2 2 |
2 2 |
2 2 |
F=(S-i /a-i )/( S2 /02 ) = (S-i /S2 )/(аг /a-i ).
(3.44а)
Плотность распределения величины Fmi, m2 , представленная на рис. 3.7, есть функция
f (F)
V 2 j |
г
Г |
1ГЦ +т2
^т |
^т,
Г
V 2 j
т |
\т1/2 Гт1 ^
F |
2 j
Vm2 7
т +т1/2
х , miF т2
при F > 0;
(3.446)
0 при F < 0.
Надо иметь в виду, что скорость возрастания и убывания функции, а также величина и положение максимума зависят от параметров ггн и т2.
Соответствующая функция распределения величины Fm1, m2 определяется через плотность распределения
г
F(F)= \f\i;)di;.
(3.44в)
Существуют статистические таблицы как с табулированными значениями функции распределения Фишера для принятого уровня значимости, так и с табулированными значениями квантилей этого распределения (см. табл. П.4 и П.5).
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
а а | ||
f(F) | ||
1,0- | m2=cc | mi=20 |
0,8- | / \ rri2=25 | |
0,6- | у ^Д ГП2=Ю | |
0,4- | ||
0,2- | £г i i | =-"------------- ► |
О
F
iF(F) 1,0 - | б ГП2=сс | ГП2=25 | ||
\ | ||||
0,8 - | W | т2=10 | ||
0,6 - | I | |||
0,4 - | mi=20 | |||
/, , | i i | i i i | —► |
3 4
6 7 F
Рис. 3.7.Плотность (а) и функция (б) F-распределения (частный случай при m1=20
Поскольку по условию нуль-гипотезы ai2 = аг2, то выражение можно представить как отношение выборочных дисперсий
F=Si2 /S22 ,
где Si2 > S22 .
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Если при проверке нулевой гипотезы Н0: ai2 = a22 = а2 альтернативной является гипотеза Н/1): ai2 > 022, то применяют одностороннее неравенство
F=Si2 /S22 > Fa,m1,m2.
Для альтернативной гипотезы Н/2): ai2 ф аг2, когда соотношение между генеральными дисперсиями неизвестно, различие между дисперсиями считают значимым, если выполняется условие
F=S12 /S22 > F(a/2),mi,m2.
Таким образом, алгоритм решения задачи сводится к следующему.
Пусть по результатам испытаний двух независимых выборок объемом щ и п2 из нормально распределенных совокупностей подсчитаны оценки дисперсий Si2 и S22, причем S2 > S22. Требуется проверить предположение (нулевую гипотезу Но) о том, что указанные выборки принадлежат генеральным совокупностям с равными дисперсиями.
В соответствии с общим алгоритмом проверки любой статистической гипотезы:
1. Н0: о? = о22 = о2.
2. Возможно два варианта альтернативной гипотезы:
Н-|(1): о2 ф о22\
Н-|(2): о2 > о22.
Предположить вариант альтернативной гипотезы Н/3': о/ < о22, конечно же, возможно, но вряд ли целесообразно при условии, что S2 > S22.
3. Используется F-критерий (критерий Фишера) - это отношение двух диспер
сий (большей к меньшей), F - статистика поэтому имеет вид
п 2
F =, (3.45)
S2
где S2 > S22-
Очевидно, что значения F всегда больше единицы.
4. Выбирается уровень значимости а.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
5. Границы критической области можно установить по таблицам квантилей F -
распределения (см. [11] или табл. П.4, П.5, а в Microsoft Excel для этого исполь
зуется функция FPACnOBP) для числа степеней свободы ащ = щ -1 и т2 = п2 - 1
и уровня значимости
• при альтернативной гипотезе Н/1): о2 ф о22 уровень значимости равен а/2 и критическая область определяется соотношением F > F(a/2) m2;
• при альтернативной гипотезе Н/2): о2 > о22 уровень значимости равен а и критическая область определяется соотношением F > Frim т .
6. Нулевую гипотезу принимают, т.е. полагают, что о2 = о22 = о2 при выполне
нии одного из неравенств (для различных альтернативных гипотез):
•F ^ F(a/2),m1,m2 ПРИН1(1> °12 * °22;
•F-Fa,m1,m2 ПРИHi(2): о2 > о22.
В случае подтверждения нулевой гипотезы, по двум выборочным дисперсиям производят оценку общей генеральной дисперсии а
2 (п1 -1)S12 +(п2 -1)5*2
S =------------------------, (3.46)
п1 + п2 ~ 2
которая может быть использована для дальнейшего анализа опытных данных.
Проиллюстрируем применение критерия Фишера на следующем примере.
Пример 3.4.Проводятся измерения одной и той же физической величины (температуры, давления, состава газа и т.п.). Первым (старым) измерительным прибором выполнено 200 измерений, которые дали выборочную дисперсию Si2 = 3,82, а вторым (новым) сделано только 15 измерений при выборочной дисперсии S22 = 2,00. Можно ли считать, что разброс в показаниях нового прибора существенно ниже, чем у старого?
1. Сформулируем нулевую гипотезу о равенстве дисперсий Н0: о? =о22 = о2.
2. Выберем альтернативную ей гипотезу H-i: о2 > о22.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
3. Воспользуемся критерием Фишера и рассчитаем статистику этого критерия F = 3,82/2,00 = 1,91.
4. Для уровня значимости а = 0,05 строим критическую область при ггн =
200-1 = 199 И ГП2 = 15-1 = 14; Fo,05;199;14 = 2,16 (см.[11] или FPAC-
ПОБР(0,05;199;14) =2,159361).
5. Подсчитанное значение статистики (F=1,91) не попадает в критическую
область (1,91 < 2,16), следовательно, нулевая гипотеза Н0: о2 = о22 = о2 прини
мается, т.е. по имеющимся экспериментальным данным нет достаточных осно
ваний считать, что результаты измерений нового прибора точнее, чем старого.
Как изменится наш вывод, если мы увеличим число измерений новым прибором до 50 при условии, что выборочная дисперсия его показаний при этом не изменится?
Табличное значение критерия Фишера при этом равно F0,o5;i99;49 = 1,49, и значение статистики попадет в критическую область 1,91 > 1,49, следовательно, в качестве рабочей может быть принята альтернативная гипотеза H-i: о2 > о22, т.е. результаты измерений новым прибором точнее, чем старым.