Гипотеза о равенстве дисперсии некоторой константе

Дисперсия является показателем точности какого-то прибора, инструмента или даже технологии выполнения наблюдений. При этом, часто встаёт вопрос о том, обеспечена ли требуемая точность работ. Подобный вопрос может быть сформулирован в форме нулевой гипотезы

H₀ = {σ² = C} (259)

против альтернативной

H_A = {σ² ≠ C}, (260)

где «С» – требуемое значение показателя точности.

Пусть мы имеем простую выборку x₁ x₂ … x_n из нормальной ГС X N(E(X); σ²_X), представляющей собой наблюдения некоторой величины «X» без постоянных погрешностей. По данным такой выборки можно построить оценивающие функции для МО и дисперсии: среднее арифметическое – = (Σx_i)/n и исправленную дисперсию – m² = Σ(x_i– )²/(n–1). В качестве эмпирического теста используется дробь

Гипотеза о равенстве дисперсии некоторой константе - student2.ru , (261)

имеющая [Ш] χ²-распределение с (n – 1) степенью свободы. Критические границы двухстороннего доверительного интервала , соответствующего уровню значимости «α», будут равны:

= и = , (262)

где r = (n – 1) – это число степеней свободы.

Нулевая гипотеза (259) отвергается, когда Гипотеза о равенстве дисперсии некоторой константе - student2.ru .

Тест (261) может быть использован как для оценки качества технологии работ, включающей в себя квалификацию исполнителя, так и для оценки точностных параметров аппаратуры, когда имеется уверенность в упомянутой квалификации персонала.

Два примера.

3.3.2.2 Распределение Фишера.

Распределение Фишера, или F-распределение, является законом распределения дроби, представляющей собой отношение двух стохастически не связанных величин «u» и «v», учитывающее тот факт, что каждая из этих величин характеризуется χ²-распределением с числом степеней свободы ν₁ и ν₂, соответственно:

Гипотеза о равенстве дисперсии некоторой константе - student2.ru . (263)

Плотность вероятности пары {u,v} равна [22]:

Гипотеза о равенстве дисперсии некоторой константе - student2.ru , (264)

когда u [0, ∞[и v [0, ∞[. Для отрицательных значений «u» и «v» f(u,v)=0.

Соответствующая функция распределения – это и есть F-распределение Фишера-Снедекора, характеризующееся двумя параметрами ν₁ и ν₂. Для часто употребляемых значений вероятностей «P» составляются таблицы с двумя входами ν₁ и ν₂ (Приложения F-распр.):

F_P(ν₁,ν₂) = P. (265)

Важно отметить, что величина 1/φ также имеет F-распределение с параметрами ν₂ и ν₁:

F_1-_P (ν₂,ν₁) = 1/ F_P(ν₁,ν₂). (266)

Распределение Фишера применяется для проверки гипотезы о равенстве двух несмещённых выборочных дисперсий m₁² и m₂², оценённых по простым выборкам из двух различных нормальных ГС, каждая из которых имеет свою дисперсию σ₁² и σ₂², соответственно. Пусть первая выборочная дисперсия m₁² вычислена по данным простой выборки, объёмом n₁, а вторая, m₂² – n₂. В таком случае дробь

Гипотеза о равенстве дисперсии некоторой константе - student2.ru ,

как это показано в [22], будет иметь F-распределение с (n₁ – 1) и (n₂ – 1) степенями свободы. Вероятность «γ» того, что эта дробь лежит в пределах между квантилями F₁ и F₂ определит доверительный интервал

P(F₁ < Гипотеза о равенстве дисперсии некоторой константе - student2.ru < F₂) = γ. (267)

Для интересующей нас дроби m₁² / m₂² интервал (267) легко преобразуется в эквивалентный:

P(F₁* < < F₂* ) = γ. (268)

Если предполагается, что дисперсии обеих ГС одинаковы, т.е. σ₁²=σ₂²=σ², то нулевая гипотеза о равенстве дисперсий записывается следующим образом:

H₀ = {m₁² = m₂² = σ²}. (269)

Интервал (267) принимает вид

P(F₁ < < F₂) = γ. (270)

Квантили F-распределения с (n₁ – 1) и (n₂ – 1) степенями свободы зависят от доверительной вероятности γ = P:

F₁ = F₍₁₊_γ_)/2(n₁–1; n₂–1), F₂ = F_(1-_γ_)/2(n₁–1; n₂–1).

Эти же квантили можно представить как функции уровня значимости α=1–γ:

F₁ = F_1-_α_/2(n₁–1; n₂–1), F₂ = F _α_/2(n₁–1; n₂–1).

Эти квантили ограничивают область

F_T = [F₁; F₂], (271)

которая с вероятностью γ = P накрывает неизвестное истинное значение отношения дисперсий.

В качестве теста используется отношение бòльшей оценки дисперсии к мèньшей. Обозначим бòльшую оценку дисперсии через m₁², а мèньшую – m₂². Тогда тест, всегда бòльший единицы, будет иметь вид:

F_Э = m₁² / m₂². (272)

Нулевая гипотеза (269) отвергается, когда F_Э Гипотеза о равенстве дисперсии некоторой константе - student2.ru F_T.

Следующий пример, данные для которого заимствованы из [23], стр. 238, иллюстрирует использование критерия Фишера-Снедекора при анализе двух выборочных дисперсий.

Пример 3.8. «Один и тот же горизонтальный угол измерен двумя наблюдателями посредством триангуляционных теодолитов ТТ-2ʺ/6ʺ № 8019 и 8002». «Сводка измерений приводится в табл. 3.Х (только секунды дуги)».

Табл. 3.Х

№№ ин-та.

Обозна- чения

№ приёмов наблюдений

6,2ʺ

6,8ʺ

5,8ʺ

5,4ʺ

6,8ʺ

5,9ʺ

3,5ʺ

4,2ʺ

6,1ʺ

4,6ʺ

5,3ʺ

6,4ʺ

6,9ʺ

5,1ʺ

4,8ʺ

5,6ʺ

6,0ʺ

5,9ʺ

5,8ʺ

8,3ʺ

4,8ʺ

Данные измерений рассматриваются как две простые выборки из двух ГС «X» и «Y». По этим данным получены несмещённые оценки математических ожиданий и дисперсий обеих ГС:

= 5,51ʺ; m_x² = 1,05; ӯ = 5,96ʺ; m_y² = 1,01.

Задача заключается в проверке на уровне значимости α = 0,05 нулевой гипотезы о равенстве дисперсий

H₀ = {m_x² = m_y² = σ²}, (273)

против альтернативной

H_A = {m_x² ≠ m_y²}. (274)

Эмпирическое значение теста (272) равно F_Э = m_x² / m_y² = 1,09, а область F_T = [F₁; F₂], с доверительной вероятностью γ = 1 – α = 0,95 и числами степеней свободы n₁–1 = n₂–1 = 10, имеет границы

F₁ = F_0,975;10;10 = 0,27 и F₂ = F_0,025;10;10 = 3,72.

Таким образом, F_Э Гипотеза о равенстве дисперсии некоторой константе - student2.ru F_T и, следовательно, нулевая гипотеза (273) не отвергается. Это означает, что качество наблюдений, выполненных разными наблюдателями одинаково приемлемо.

Критерий Кочрена.

Данный критерий применяется для анализа однородности ряда выборочных дисперсий, оценённых по «k» выборкам одинакового объёма «n».

3.3.3 Гипотезы о равенстве МО.

Чаще всего востребованы две гипотезы о равенстве МО:

1) гипотеза о равенстве МО некоторой константе – H₀ = {E(X) = C};

2) гипотеза о равенстве МО двух разных ГС – H₀ = {E(X) = E(Y)}.

Первая гипотеза может быть использована при компарировании или эталонировании прибора с целью оценивания его постоянной ошибки «δ». Примем значение эталона за константу «С». Выполнив ряд некоррелированных равноточных измерений эталона, мы получим простую выборку x₁ x₂ … x_nиз нормальной ГС X N(E(X) = C; σ²_X). По материалам такой простой выборки оцениваем генеральные параметры E(X) = C и дисперсию σ²_X.Несмещёнными оценками будут среднее арифметическое – = (Σx_i)/n и исправленная дисперсия – m² = Σ(x_i– )²/(n–1). Далее, используя тот факт [22], что дробь

Гипотеза о равенстве дисперсии некоторой константе - student2.ru (237)

подчиняется t-распределению с (n – 1) степенью свободы, проверяем на уровне значимости «α» нулевую гипотезу

H₀ = {E(X) = C} (270)

против альтернативной

H_A = {E(X) ≠ C}. (271)

В качестве теста используется двухсторонний ДИ t_T = [t_H; t_B], границы которого t_H и t_B представляют собой квантили распределения Стьюдента:

t_B = t_r_;1-_a/2и t_H = – t_B, (272)

где r = n – 1 – число степеней свободы статистики (237).

Нулевая гипотеза (270) отвергается, если Гипотеза о равенстве дисперсии некоторой константе - student2.ru . Это означает, что проверяемый прибор имеет постоянную погрешность, равную разности СА изначению эталона «С»: δ = – C, которую надлежит учитывать. СКО постоянной погрешности «δ»определяется СКО СА:

m_δ = m= m / . (273)

Вторая гипотеза бывает востребована в ситуации, когда одна и та же величина определяется двумя разными технологиями, вероятностными моделями которых служат две СВ «X» и «Y».

3.3.4 Гипотезы о парной некоррелированности случайных величин.

3.3.5 Сводная таблица гипотез, наиболее часто используемых на практике.

При выполнении обработки независимых многократных измерений одной или нескольких величин, не объединенных в единую систему, часто приходится искать ответы на вопросы, касающиеся практического использования результатов наблюдений. Например, обрабатывая материалы эталонирования или компарирования приборов, необходимо оценить значимость полученной постоянной систематической поправки. При анализе любых измерений бывает необходимо решить вопрос о достижении требуемой точности, или сравнить различные технологии как по точности, так и по результативности, или убедиться в независимости массивов данных. Приводимая здесь сводная таблица (Табл. 3.3.5) объединяет гипотезы, описанные в предыдущих параграфах, и позволяет находить ответы на некоторые из вышеприведенных вопросов.

Сводная таблица проверки гипотез.

Табл. 3.3.5

Гипотеза	Проверка гипотезы	Примечания
Текст	Условная запись	Тест	Границы критической области (ГКО)

1.Закон распределения – нормальный	H = {X N(E(X) = ; s_X = s_X)}	= =	= = ; r = q – 3	Квантили распределения Пирсона
2.Асимметрия незнàчима	H = {As = 0}	= /	t_B = – t_H ; t_B 2	Приближенная нормальность
3.Эксцесс незнàчим	H = {Ex = 0}	= / – 3	t_B = – t_H ; t_B 2	Приближенная нормальность
4.МО равно заданному значению	H₀ = {E(X) = C}	= ( – C) / s	t_B = t_r;1-_a/2; t_H = – t_B; r = n – 1	Квантили распределения Стьюдента
5.Дисперсия равна заданному значению	H = { = C}		= = ; r = n – 1	Квантили распределения Пирсона
6.Дисперсии двух ГС X и Y равны	H = { = }	= / ; =max{ }	F_H = 1 / F_B; F_B= r_1,2 = n_X,Y – 1.	Квантили распределения Фишера
7.МО двух ГС X и Y равны	H = {E(X) = =E(Y)}, при условии, что = .	( )* *	t_B = t_r;1-_a/2; t_H = – t_B; r = n – 2	Квантили распределения Стьюдента
8.Корреляция двух ГС X и Y отсутствует	H = {r_XY = 0}	= r_XY* *	t_B = – t_H; t_B = t_m;1-_a/2; m = n – 2	Квантили распределения Стьюдента
9. Разность МО двух ГС X и Y не значима	H = {E(d) = 0} (d = x – y)		t_B = – t_H; t_B = t_m;1-_a/2; m = n – 1	Квантили распределения Стьюдента
10. Измерение x_i не содержит грубой ошибки	H = { = 0} ( = – x_i)	=	t_B = – t_H; t_B = t_m;1-_a/2; m = n – 1	Квантили распределения Стьюдента

Гипотеза отвергается на уровне значимости a, когда тест попадает в критическую область, т.е. Гипотеза о равенстве дисперсии некоторой константе - student2.ru .

Кроме общепринятых обозначений, приводимых в главах 3.1 - 3.3, в таблице дополнительно введены следующие обозначения:

Гипотеза 7. Гипотеза о равенстве дисперсии некоторой константе - student2.ru = [vv]_X = * (n_X – 1), где – дисперсия по выборке из ГС X, n_X – объем этой выборки, [vv]_X – сумма квадратов уклонений элементов выборки x_i от их СА Гипотеза о равенстве дисперсии некоторой константе - student2.ru ;

Гипотеза 7. Гипотеза о равенстве дисперсии некоторой константе - student2.ru = [vv]_Y = * (n_Y – 1), где - дисперсия по выборке из ГС Y, n_Y - объем этой выборки, [vv]_Y - сумма квадратов уклонений элементов выборки y_j от их СА Гипотеза о равенстве дисперсии некоторой константе - student2.ru ;