Сравнение двух рядов наблюдений

При проведении и анализе результатов экспериментальных исследова­ний часто приходится сравнивать две партии изделий, показания двух или не­скольких приборов, анализировать результаты работы однотипных агрегатов, сравнивать результаты исследований двух проб материалов и т.д. Вот некото­рые примеры подобных ситуаций.

1. Необходимо сравнить показания двух приборов, измеряющих одну и ту же величину, когда этими рабочими средствами измерений получено два ряда наблюдений данной величины. Одинакова ли точность измерения одного и того же технологического параметра разными приборами?

2. Требуется поверить рабочее средство измерения (т.е. определить, не выходят ли погрешности его измерений за пределы регламентированных зна­чений) с помощью образцового средства измерения. Равно ли математическое ожидание показаний данного прибора действительному значению измеряемого параметра?

3. Два агрегата выпускают одну и ту же продукцию. Необходимо сделать вывод о том, какой из них лучше или хуже в каком-либо смысле.

Решение подобных задач осуществляется также с использованием аппа­рата проверки статистических гипотез. Ведь если нам необходимо было бы сравнить две случайные величины X и У, имеющие нормальное распределе­ние, при известных их математических ожиданиях и дисперсиях Мх; ох2 и Му; оу2, то вопрос, очевидно, решался бы достаточно просто. Две случайные вели-

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

чины с нормальным распределением равны между собой (имеют одинаковое распределение, т.е. имеют одну и ту же функцию распределения F(X) = F(Y) или плотность распределения f(X) = f(Y)), когда равны между собой их матема­тические ожидания (Мх = Му) и дисперсии (ох2 = оу2), поскольку только эти два параметра полностью определяют нормальное (двухпараметрическое) распре­деление (см. (2.12) или (2.21)).

Однако, как это уже неоднократно ранее отмечалось, любой из парамет­ров распределения случайной величины 0 может быть найден лишь по всей генеральной совокупности, т.е. только теоретически при проведении бесконеч­но большого количества опытов. Практически, по выборке ограниченного объе­ма, исследователь может определить только приближенное значение парамет­ра - его оценку 0*. При этом вероятность того, что оценка 0* совпадет со зна­чением оцениваемого параметра 0, очень мала. Следовательно, даже если равны между собой параметры распределений двух случайных величин (0Х = 0У), то их оценки скорее всего не будут одинаковыми (0Х* ф 0у*).

Поэтому при сравнении двух случайных величин обычно приходится вы­сказывать и проверять нулевую гипотезу Н0: 0Х = 0У, при альтернативных гипо­тезах типа Н-|(1): 0Х < 0У или Н/2): 0Х > 0У. Н/3): 0Х ф 0у,

Сравнение двух дисперсий

При выполнении измерений в различных условиях часто возникает зада­ча сравнения степени разброса (дисперсий) исследуемых параметров (случай­ных величин).

Проверка гипотезы о равенстве дисперсий имеет большое значение, так как измеряемая дисперсией величина рассеяния характеризует такие исключи­тельно важные показатели, как точность машин, приборов, стабильность тех­нологических процессов, качество готовой продукции и т.д. Поэтому, например, о преимуществах той или иной технологии или о качестве выпускаемой продук­ции вывод можно часто сделать в результате сравнения дисперсий тех пара­метров, которые их характеризуют.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Таким образом, требуется установить, являются ли выборочные диспер­сии S2 ф S22 со степенями свободы ггн и т2 значимо отличающимися или же они характеризуют выборки, взятые из одной и той же генеральной совокупно-

сти или из генеральных совокупностей с равными дисперсиями (<л




а2

= а2).

В этом случае нулевая гипотеза формулируется в виде Н0: о2 = а22= а2 , т.е. между двумя генеральными дисперсиями различия нет при заданном уровне значимости а.

Для проверки этой гипотезы используется критерий, основанный на рас­пределении Фишера, зависящем только от числа степеней свободы ггн и т2. Аналитическое выражение критерия Фишера имеет вид


2 2
2 2
2 2
2 2

F=(S-i /a-i )/( S2 /02 ) = (S-i /S2 )/(аг /a-i ).

(3.44а)

Плотность распределения величины Fmi, m2 , представленная на рис. 3.7, есть функция

f (F)


V 2 j

г


Г

1ГЦ +т2

^т,

Г

V 2 j


т

\т1/2 Гт1 ^

F

2 j

Vm2 7

т +т1/2

х , miF т2




при F > 0;

(3.446)

0 при F < 0.

Надо иметь в виду, что скорость возрастания и убывания функции, а так­же величина и положение максимума зависят от параметров ггн и т2.

Соответствующая функция распределения величины Fm1, m2 определяет­ся через плотность распределения

г

F(F)= \f\i;)di;.

(3.44в)

Существуют статистические таблицы как с табулированными значениями функции распределения Фишера для принятого уровня значимости, так и с та­булированными значениями квантилей этого распределения (см. табл. П.4 и П.5).

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

а а  
f(F)    
1,0- m2=cc mi=20
0,8- / \ rri2=25  
0,6- у ^Д ГП2=Ю  
0,4-    
0,2- £г i i =-"------------- ►

О




F


iF(F) 1,0 - б ГП2=сс ГП2=25    
  \  
0,8 - W   т2=10  
0,6 - I      
0,4 -   mi=20  
/, , i i i i i —►




3 4



6 7 F

Рис. 3.7.Плотность (а) и функция (б) F-распределения (частный случай при m1=20

Поскольку по условию нуль-гипотезы ai2 = аг2, то выражение можно представить как отношение выборочных дисперсий

F=Si2 /S22 ,

где Si2 > S22 .

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Если при проверке нулевой гипотезы Н0: ai2 = a22 = а2 альтернативной является гипотеза Н/1): ai2 > 022, то применяют одностороннее неравенство

F=Si2 /S22 > Fa,m1,m2.

Для альтернативной гипотезы Н/2): ai2 ф аг2, когда соотношение между генеральными дисперсиями неизвестно, различие между дисперсиями считают значимым, если выполняется условие

F=S12 /S22 > F(a/2),mi,m2.

Таким образом, алгоритм решения задачи сводится к следующему.

Пусть по результатам испытаний двух независимых выборок объемом щ и п2 из нормально распределенных совокупностей подсчитаны оценки диспер­сий Si2 и S22, причем S2 > S22. Требуется проверить предположение (нулевую гипотезу Но) о том, что указанные выборки принадлежат генеральным совокуп­ностям с равными дисперсиями.

В соответствии с общим алгоритмом проверки любой статистической ги­потезы:

1. Н0: о? = о22 = о2.

2. Возможно два варианта альтернативной гипотезы:

Н-|(1): о2 ф о22\

Н-|(2): о2 > о22.

Предположить вариант альтернативной гипотезы Н/3': о/ < о22, конечно же, возможно, но вряд ли целесообразно при условии, что S2 > S22.

3. Используется F-критерий (критерий Фишера) - это отношение двух диспер­
сий (большей к меньшей), F - статистика поэтому имеет вид

п 2

F =, (3.45)

S2

где S2 > S22-

Очевидно, что значения F всегда больше единицы.

4. Выбирается уровень значимости а.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

5. Границы критической области можно установить по таблицам квантилей F -
распределения (см. [11] или табл. П.4, П.5, а в Microsoft Excel для этого исполь­
зуется функция FPACnOBP) для числа степеней свободы ащ = щ -1 и т2 = п2 - 1
и уровня значимости

• при альтернативной гипотезе Н/1): о2 ф о22 уровень значимости равен а/2 и критическая область определяется соотношением F > F(a/2) m2;

• при альтернативной гипотезе Н/2): о2 > о22 уровень значимости равен а и критическая область определяется соотношением F > Frim т .

6. Нулевую гипотезу принимают, т.е. полагают, что о2 = о22 = о2 при выполне­
нии одного из неравенств (для различных альтернативных гипотез):

•F ^ F(a/2),m1,m2 ПРИН1(1> °12 * °22;

•F-Fa,m1,m2 ПРИHi(2): о2 > о22.

В случае подтверждения нулевой гипотезы, по двум выборочным дис­персиям производят оценку общей генеральной дисперсии а

2 (п1 -1)S12 +(п2 -1)5*2
S =------------------------, (3.46)

п1 + п2 ~ 2

которая может быть использована для дальнейшего анализа опытных данных.

Проиллюстрируем применение критерия Фишера на следующем приме­ре.

Пример 3.4.Проводятся измерения одной и той же физической величи­ны (температуры, давления, состава газа и т.п.). Первым (старым) измеритель­ным прибором выполнено 200 измерений, которые дали выборочную диспер­сию Si2 = 3,82, а вторым (новым) сделано только 15 измерений при выборочной дисперсии S22 = 2,00. Можно ли считать, что разброс в показаниях нового при­бора существенно ниже, чем у старого?

1. Сформулируем нулевую гипотезу о равенстве дисперсий Н0: о? =о22 = о2.

2. Выберем альтернативную ей гипотезу H-i: о2 > о22.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

3. Воспользуемся критерием Фишера и рассчитаем статистику этого кри­терия F = 3,82/2,00 = 1,91.

4. Для уровня значимости а = 0,05 строим критическую область при ггн =

200-1 = 199 И ГП2 = 15-1 = 14; Fo,05;199;14 = 2,16 (см.[11] или FPAC-

ПОБР(0,05;199;14) =2,159361).

5. Подсчитанное значение статистики (F=1,91) не попадает в критическую
область (1,91 < 2,16), следовательно, нулевая гипотеза Н0: о2 = о22 = о2 прини­
мается, т.е. по имеющимся экспериментальным данным нет достаточных осно­
ваний считать, что результаты измерений нового прибора точнее, чем старого.

Как изменится наш вывод, если мы увеличим число измерений новым прибором до 50 при условии, что выборочная дисперсия его показаний при этом не изменится?

Табличное значение критерия Фишера при этом равно F0,o5;i99;49 = 1,49, и значение статистики попадет в критическую область 1,91 > 1,49, следователь­но, в качестве рабочей может быть принята альтернативная гипотеза H-i: о2 > о22, т.е. результаты измерений новым прибором точнее, чем старым.

Наши рекомендации