П.2. Построение доверительных интервалов с использованием центральной статистики
Определение 24.5. Центральной статистикой для параметра Q называется функция Ф(х1, …, хn, Q) = Ф(Х; Q), где х1, …, хn – случайная выборка, распределение которой не зависит от Q при любых хk (k = 1, …, n), Ф(Х, Q) непрерывна и монотонна по Q.
Схема построения доверительных интервалов с использованием центральной статистики следующая.
1) По известной функции распределения центральной статистики
Ф(Хn, Q) находятся числа m1 и m2, удовлетворяющие условию
Р(m1 £ Ф(Хn, Q) £ m1) = 1 - a.
2) Ищутся границы и из уравнений
= Ф-1(Xn, m1), = Ф-1(Xn, m2),
если Ф(Хn, Q) монотонно возрастающая функция, и
= Ф-1(Xn, m2), = Ф-1(Xn, m1),
если Ф(Хn, Q) монотонно убывающая функция.
Ф-1(Хn, Q) – функция, обратная Ф(Хn, Q).
Данный метод удобно применять при построении доверительных интервалов для оценки независимых параметров а и s2 нормального распределения.
Известно следующее утверждение.
Теорема. (Теорема Фишера) Пусть выборка х1, х2, …, хn извлечена из генеральной совокупности, имеющей нормальное распределение с параметрами а и s2. Пусть и – выборочная средняя и дисперсия – случайные величины, принимающие различные значения в различных выборках. Тогда
1) СВ имеет нормальное распределение с параметрами M(N*) = 0, D(N*) = 1.
2) СВ имеет распределение c2(n – 1).
3) СВ имеет распределение Стьюдента t (n – 1).
4) СВ и – независимы.
Данную теорему примем без доказательства.
Построим доверительные интервалы для оценки неизвестных параметров а и s2 нормального распределения.
1) По выборке х1, …, хn построим доверительный интервал для неизвестного математического ожидания а при известной дисперсии.
Рассмотрим СВ . Данная функция распределена по нормальному закону с параметрами а = 0 и s2 = 1, непрерывна и монотонно убывает относительно параметра а. Значит, N* является центральной статистикой.
Составим двойное неравенство
,
где величины m1 и m2 подобраны таким способом, чтобы выполнялось условие . Заметим, что это условие не является однозначным, поэтому, чтобы интервал оказался минимальной длины, следует положить m2 = - m1 = t.
Получим
,
где t – значение аргумента функции Лапласа Ф(t), при котором Ф(t) = g.
П р и м е р 1. Найти доверительный интервал с надежностью 0,95 для неизвестного математического ожидания а нормально распределенной СВ Х, если s2 = 16, = 12, объем выборки n = 100.
Решение. Поскольку СВ Х распределена нормально и известно s2, то
.
Значение t найдем из условия Ф(t) = 0,95. Из таблицы II для функции Лапласа найдем t = 1,96. Получим
,
т.е.
11,216 £ а £ 12,784.
2) В предыдущем пункте мы полагали, что параметр s2 известен. Однако на практике такие случаи встречаются редко. Поэтому усложним предыдущую задачу и поставим цель найти доверительный интервал для неизвестного математического ожидания СВ Х, имеющей нормальное распределение при неизвестном параметре s2.
Пусть по имеющейся выборке мы рассчитали и выборочную дисперсию .
В качестве центральной статистики в этом случае используем СВ . Действительно, данная случайная величина имеет распределение Стьюдента t(n – 1), не зависящее от , непрерывна и монотонно убывает по а. Найдем значения m2 = - m1 = tg. Получим
или
,
где tg - квантиль уровня распределения Стьюдента.
П р и м е р 2. Найдем доверительный интервал для неизвестного математического ожидания а нормально распределенной СВ Х с надежностью 0,95, если (исправленная выборочная дисперсия) равна 16, = 12, n = 100.
Решение. Поскольку , то
.
Для данной задачи
.
Значение tg = t(0,95; 99) найдем по таблице IV (см. приложение). tg = 1,984.
12 – 0,7936 £ а £ 12 + 0,7936,
11,2064 £ а £ 12,7936.
Заметим, что при схожих условиях примеров 24.1 и 24.2 доверительный интервал для параметра а в последнем случае оказался шире, что вполне естественно вследствие уменьшения информации о генеральной совокупности во втором примере.
3) Найдем доверительный интервал для неизвестного параметра s2 СВ Х, имеющей нормальное распределение.
В качестве центральной статистики используем величину . Действуя аналогично тому, как это делалось в предыдущих случаях, получим
или
,
где квантили хg и х1-g находятся из таблицы VI распределения c2 при данных .
П р и м е р 3. Найти доверительный интервал для неизвестного параметра s нормально распределенной СВ Х, если = 10, n = 20, a = 0,05.
Решение.
.
Из таблицы VI найдем х0,975(19) = 32,9, х0,025(19) = 8,91.
,
57,7 £ s2 £ 213,2,
7,6 £ s £ 14,6.
Таблица для c2 составляется обычно для n £ 30. При выборках большего объема можно считать, что величина имеет стандартное нормальное распределение с параметрами а = 0 и s = 1. Поэтому при расчете доверительного интервала надо полагать , . Значение t определяется из уравнения Ф(t) = g.