Сравнение двух рядов наблюдений

При проведении и анализе результатов экспериментальных исследований часто приходится сравнивать две партии изделий, показания двух или нескольких приборов, анализировать результаты работы однотипных агрегатов, сравнивать результаты исследований двух проб материалов и т.д. Вот некоторые примеры подобных ситуаций.

1. Необходимо сравнить показания двух приборов, измеряющих одну и ту же величину, когда этими рабочими средствами измерений получено два ряда наблюдений данной величины. Одинакова ли точность измерения одного и того же технологического параметра разными приборами?

2. Требуется поверить рабочее средство измерения (т.е. определить, не выходят ли погрешности его измерений за пределы регламентированных значений) с помощью образцового средства измерения. Равно ли математическое ожидание показаний данного прибора действительному значению измеряемого параметра?

3. Два агрегата выпускают одну и ту же продукцию. Необходимо сделать вывод о том, какой из них лучше или хуже в каком-либо смысле.

Решение подобных задач осуществляется также с использованием аппарата проверки статистических гипотез. Ведь если нам необходимо было бы сравнить две случайные величины X и У, имеющие нормальное распределение, при известных их математических ожиданиях и дисперсиях М_х; о_х² и М_у; оу², то вопрос, очевидно, решался бы достаточно просто. Две случайные вели-

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

чины с нормальным распределением равны между собой (имеют одинаковое распределение, т.е. имеют одну и ту же функцию распределения F(X) = F(Y) или плотность распределения f(X) = f(Y)), когда равны между собой их математические ожидания (М_х = М_у) и дисперсии (о_х² = о_у²), поскольку только эти два параметра полностью определяют нормальное (двухпараметрическое) распределение (см. (2.12) или (2.21)).

Однако, как это уже неоднократно ранее отмечалось, любой из параметров распределения случайной величины 0 может быть найден лишь по всей генеральной совокупности, т.е. только теоретически при проведении бесконечно большого количества опытов. Практически, по выборке ограниченного объема, исследователь может определить только приближенное значение параметра - его оценку 0*. При этом вероятность того, что оценка 0* совпадет со значением оцениваемого параметра 0, очень мала. Следовательно, даже если равны между собой параметры распределений двух случайных величин (0_Х = 0_У), то их оценки скорее всего не будут одинаковыми (0_Х* ф 0_у*).

Поэтому при сравнении двух случайных величин обычно приходится высказывать и проверять нулевую гипотезу Н₀: 0_Х = 0_У, при альтернативных гипотезах типа Н-|⁽¹⁾: 0_Х < 0_У или Н/²⁾: 0_Х > 0_У. Н/³⁾: 0_Х ф 0_у,

Сравнение двух дисперсий

При выполнении измерений в различных условиях часто возникает задача сравнения степени разброса (дисперсий) исследуемых параметров (случайных величин).

Проверка гипотезы о равенстве дисперсий имеет большое значение, так как измеряемая дисперсией величина рассеяния характеризует такие исключительно важные показатели, как точность машин, приборов, стабильность технологических процессов, качество готовой продукции и т.д. Поэтому, например, о преимуществах той или иной технологии или о качестве выпускаемой продукции вывод можно часто сделать в результате сравнения дисперсий тех параметров, которые их характеризуют.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Таким образом, требуется установить, являются ли выборочные дисперсии S² ф S₂² со степенями свободы ггн и т₂ значимо отличающимися или же они характеризуют выборки, взятые из одной и той же генеральной совокупно-

сти или из генеральных совокупностей с равными дисперсиями (<л

а₂

= а²).

В этом случае нулевая гипотеза формулируется в виде Н₀: о² = а₂²= а² , т.е. между двумя генеральными дисперсиями различия нет при заданном уровне значимости а.

Для проверки этой гипотезы используется критерий, основанный на распределении Фишера, зависящем только от числа степеней свободы ггн и т₂. Аналитическое выражение критерия Фишера имеет вид

2 2

F=(S-i /a-i )/( S2 /02 ) = (S-i /S2 )/(аг /a-i ).

(3.44а)

Плотность распределения величины F_mi, _m2 , представленная на рис. 3.7, есть функция

f (F)

V 2 j

1ГЦ +т₂

^т

^т,

V 2 j

\^т1/2 Гт₁ ^

2 j

V^m2 7

т +т1/2

_х , ^miF т₂

при F > 0;

(3.446)

0 при F < 0.

Надо иметь в виду, что скорость возрастания и убывания функции, а также величина и положение максимума зависят от параметров ггн и т₂.

Соответствующая функция распределения величины F_m1, _m2 определяется через плотность распределения

F(F)= \f\i;)di;.

(3.44в)

Существуют статистические таблицы как с табулированными значениями функции распределения Фишера для принятого уровня значимости, так и с табулированными значениями квантилей этого распределения (см. табл. П.4 и П.5).

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

а а
f(F)
1,0-	m₂=cc	mi=20
0,8-	/ \ rri2=25
0,6-	у ^Д ГП2=Ю
0,4-
0,2-	£г i i	=-"------------- ►

iF(F) 1,0 -	б ГП2=сс	ГП2=25
	\
0,8 -	W		т₂=10
0,6 -	I
0,4 -			mi=20
	/, ,	i i	i i i	—►

3 4

6 7 F

Рис. 3.7.Плотность (а) и функция (б) F-распределения (частный случай при m₁=20

Поскольку по условию нуль-гипотезы ai² = аг², то выражение можно представить как отношение выборочных дисперсий

F=Si² /S2² ,

где Si² > S2² .

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Если при проверке нулевой гипотезы Н₀: ai² = a₂² = а² альтернативной является гипотеза Н/¹⁾: ai² > 02², то применяют одностороннее неравенство

F=Si² /S2² > F_a,m1,m2.

Для альтернативной гипотезы Н/²⁾: ai² ф аг², когда соотношение между генеральными дисперсиями неизвестно, различие между дисперсиями считают значимым, если выполняется условие

F=S1² /S2² > F(_a/2),mi,m2.

Таким образом, алгоритм решения задачи сводится к следующему.

Пусть по результатам испытаний двух независимых выборок объемом щ и п₂ из нормально распределенных совокупностей подсчитаны оценки дисперсий Si² и S₂², причем S² > S₂². Требуется проверить предположение (нулевую гипотезу Но) о том, что указанные выборки принадлежат генеральным совокупностям с равными дисперсиями.

В соответствии с общим алгоритмом проверки любой статистической гипотезы:

1. Н₀: о? = о₂² = о².

2. Возможно два варианта альтернативной гипотезы:

Н-|⁽¹⁾: о² ф о₂²\

Н-|⁽²⁾: о² > о₂².

Предположить вариант альтернативной гипотезы Н/³': о/ < о₂², конечно же, возможно, но вряд ли целесообразно при условии, что S² > S₂².

3. Используется F-критерий (критерий Фишера) - это отношение двух диспер
сий (большей к меньшей), F - статистика поэтому имеет вид

п 2

F =, (3.45)

S₂

где S² > S₂²-

Очевидно, что значения F всегда больше единицы.

4. Выбирается уровень значимости а.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

5. Границы критической области можно установить по таблицам квантилей F -
распределения (см. [11] или табл. П.4, П.5, а в Microsoft Excel для этого исполь
зуется функция FPACnOBP) для числа степеней свободы ащ = щ -1 и т₂ = п₂ - 1
и уровня значимости

• при альтернативной гипотезе Н/¹⁾: о² ф о₂² уровень значимости равен а/2 и критическая область определяется соотношением F > F_(a/2) _m2;

• при альтернативной гипотезе Н/²⁾: о² > о₂² уровень значимости равен а и критическая область определяется соотношением F > F_rim _т .

6. Нулевую гипотезу принимают, т.е. полагают, что о² = о₂² = о² при выполне
нии одного из неравенств (для различных альтернативных гипотез):

•F ^ F(a_/2),m_1,_m2 ^ПР^И^Н1^(1> °1² * °2²;

•F-Fa,_m1,m₂ ^ПР^ИHi⁽²⁾: о² > о₂².

В случае подтверждения нулевой гипотезы, по двум выборочным дисперсиям производят оценку общей генеральной дисперсии а

2 (п₁ -1)S₁² +(п₂ -1)5*₂S =------------------------, (3.46)

^п₁ + ^п2 ~ 2

которая может быть использована для дальнейшего анализа опытных данных.

Проиллюстрируем применение критерия Фишера на следующем примере.

Пример 3.4.Проводятся измерения одной и той же физической величины (температуры, давления, состава газа и т.п.). Первым (старым) измерительным прибором выполнено 200 измерений, которые дали выборочную дисперсию Si² = 3,82, а вторым (новым) сделано только 15 измерений при выборочной дисперсии S2² = 2,00. Можно ли считать, что разброс в показаниях нового прибора существенно ниже, чем у старого?

1. Сформулируем нулевую гипотезу о равенстве дисперсий Н₀: о? =о₂² = о².

2. Выберем альтернативную ей гипотезу H-i: о² > о₂².

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

3. Воспользуемся критерием Фишера и рассчитаем статистику этого критерия F = 3,82/2,00 = 1,91.

4. Для уровня значимости а = 0,05 строим критическую область при ггн =

200-1 = 199 И ГП2 = 15-1 = 14; Fo,05;199;14 = 2,16 (см.[11] или FPAC-

ПОБР(0,05;199;14) =2,159361).

5. Подсчитанное значение статистики (F=1,91) не попадает в критическую
область (1,91 < 2,16), следовательно, нулевая гипотеза Н₀: о² = о₂² = о² прини
мается, т.е. по имеющимся экспериментальным данным нет достаточных осно
ваний считать, что результаты измерений нового прибора точнее, чем старого.

Как изменится наш вывод, если мы увеличим число измерений новым прибором до 50 при условии, что выборочная дисперсия его показаний при этом не изменится?

Табличное значение критерия Фишера при этом равно F₀,o5;i99;49 = 1,49, и значение статистики попадет в критическую область 1,91 > 1,49, следовательно, в качестве рабочей может быть принята альтернативная гипотеза H-i: о² > о₂², т.е. результаты измерений новым прибором точнее, чем старым.

Наши рекомендации

Анализ и прогноз рядов наблюдений

Задания на соотнесение двух рядов.

Обработка неравнорассеянных рядов наблюдений

Оценка закономерностей многолетних колебаний уровня грунтовых вод. Периодограмный анализ наиболее длинных рядов наблюдений

Статистические оценки взаимосвязи двух временных рядов

Понятие о моделировании рядов наблюдений

Сравнение игр двух классов

Теоретические положения. Восстановление пропусков наблюдений и приведение рядов к многолетнему периоду

Анализ и прогноз рядов наблюдений

Сравнение двух этапов

← Предыдущая страница | Следующая страница →