Интервальная оценка мат.ожидания
Интервальной называют оценку, которая определяется двумя числами – концами интервала.
Допустим, что для изучения некоторой случайной величины X (признака генеральной совокупности) необходимо по статистическим данным произвестиоценку неизвестного ее параметра θ (это может быть М(Х), D(Х) или р) с определенной степенью точности и надежности, т. е. надо указать границы, в которых практически достоверно лежит этот неизвестный параметр θ.
Это означает, что надо найти такую выборочную оценку для искомого параметра θ, при которой с наибольшей вероятностью (надежностью) будет выполняться неравенство:
Отсюда видно, что чем меньше e, тем точнее характеризуется неизвестный параметр θ с помощью выборочной оценки . Следовательно, число eхарактеризует точность оценки параметра θ.
Надежность выполнения неравенства оценивается числом g (α = 1 – γ), которое называют доверительной вероятностью:
g = Р( ). (1.11)
Итак, число e характеризует точность оценки параметра θ; число g – характеризует надежность оценки параметра θ.
В практических задачах либо заранее задается надежность g (риск α) и надо найти точность оценки, либо, наоборот, задается точность e, а требуется определить надежность оценки.
Как правило, доверительную вероятность g задают числом, близким к единице: 0,95; 0,97; 0,99; 0,999.
Формула (1.11) означает, что с вероятностью g неизвестное значение параметра θ находится в интервале Ig = ( – e, + e).
Очевидно, чем больше требуется точность e (т. е., чем меньше длина интервала), тем меньше вероятность накрыть интервалом Ig искомый параметр θ, и, наоборот, с уменьшением точности e (увеличением длины интервала) увеличивается надежность g накрыть интервалом Ig параметр θ (рис. 1.5).
Рис. 1.5. Доверительный интервал
Замечание. Если число g = 0,95, это означает, что в среднем в 95 случаях из 100 интервал Ig накроет параметр θ и в 5 случаях из 100 не накроет его.
Оценка , будучи функцией случайной выборки, является случайной величиной, ε также случайна: ее значение зависит от вероятности γ и, как правило, от выборки. Поэтому доверительный интервал случаен и выражение (1.11) следует читать так: «Интервал ( –ε, +ε) накроет параметр θ с вероятностью γ»,а не «Параметр θ попадет в интервал ( –ε, +ε) с вероятностью γ».
Дана выборка (x1, x2, …, xn) объема n из генеральной совокупности с генеральным средним mx (неизвестный параметр) и генеральной дисперсией s2 (известна). Ищется интервал [Θ1, Θ2], в котором mx может находиться с доверительной вероятностью γ. Задача может быть решена двумя путями.
I. Предполагая, что предварительно определена точечная оценка mx – выборочное среднее , в качестве статистики для получения Θ1 = = Θ1(x1, x2, …, xn) и Θ2 = Θ2 (x1, x2, …,xn) традиционно рассматривается нормированное выборочное среднее
z = .
Случайная величина z имеет распределение:
1. нормальное, с нулевым математическим ожиданием и единичной дисперсией (z N(0, 1)), если выборка берется из нормальной генеральной совокупности;
2. асимптотически нормальное (z ~N(0, 1)), если генеральная совокупность имеет распределение, отличное от нормального.