Доверительные интервалы
Выше рассмотренная оценка параметра являлась точечной (одним числом). При выборке большого объема точечная оценка параметра близка к самому параметру. Однако, если число наблюдений мало, то возможно значительное расхождение между и t.
Чтобы получить представление о точности и надежности оценки параметра используют интервальную оценку параметра. Параметр t приближают некоторым интервалом ( 1; 2).
Интервальной оценкой параметра t называется числовой интервал ( 1; 2), который с заданной вероятностью γ накрывает неизвестное значение параметра t. Такой интервал ( 1; 2) называется доверительным интервалом, вероятность γ – доверительной вероятностью.
Заметим, что 1 и 2 находятся по выборочным данным, т.е. случайные величины, а t – некоторое определенное, хотя и неизвестное нам, число. Рассмотрим вопрос о построении доверительного интервала ( 1; 2) для непрерывной случайной величины Х ,имеющей нормальное распределение. Именно эта задача имеет большое практическое значение, особенно при обработке результатов измерений. Будем искать доверительный интервал для математического ожидания, когда σ известно, и когда σ неизвестно. Напомним, что плотность распределения вероятностей в случае
Х N(m; σ ): f(х) = , где m – математическое ожидание, σ – среднее квадратическое отклонение.
Доверительный интервал для m при известном σ.
Пусть непрерывная случайная величина Х имеет нормальное распределение Х N(m; σ ). Случайная величина (х) = также будет подчинена нормальному закону распределения (результаты опытов х1, х2, . . . , хn – независимые случайные величины, распределенные нормально с параметрами m и σ).
При этом М( (х)) = м(х) = m,
D( (x)) = = n D(x) = => (x)) =
Тогда параметры распределения случайной величины (х) : (m; ) .
Найдем такое , чтобы P( -δ < m < +δ) = γ. Воспользуемся формулой для нахождения вероятности попадания в интервал нормально распределенной случайной величины: P(׀x-m׀ < ε) = 2Ф , где Ф(х) – функция Лапласа. Тогда: P( -δ < m < +δ) = P(׀m- ׀< δ) = P(׀ – m׀ < δ) = 2Ф ( ) = 2Ф( ) = γ.
Обозначим t = , находится t по таблицам значений функции Лапласа из условия Ф(t) = . Тогда интервал ( - δ; + δ) или ( - ; + ) с заданной вероятностью γ накрывает неизвестное значение m. Таким образом, доверительным интервалом для m является интервал ( - ; + ), где t находится из условия Ф(t) = .
Пример. Произведено 5 независимых испытаний над непрерывной случайной величиной Х , распределенной нормально с σ =2:
i | |||||
xi | -25 | -20 |
Найти оценку для М(х) и построить для нее 90% доверительный интервал. Решение: (х) = (-25+34-20+10+21) = 4 γ = 0,9 => Ф(t) = 0,45 => t = 1,65 = ≈ 1,47 => 90% доверительным интервалом будет: (4 - 1,47; 4 + 1,47) или (2,53; 5,47).
Доверительный интервал для m при неизвестном σ.
Имеем два неизвестных m и σ. Можно показать, что в этом случае доверительным интервалом для m будет интервал ( - ; + ), где - выборочное среднее, n – объем выборки, - исправленное среднее квадратическое отклонение. = , t – находится по таблицам значений функции Стьюдента в зависимости от γ и n ( распределение Стьюдента при n →∞ приближается к нормальному). При достаточно больших n (практически при n>20) t можно искать из условия Ф(t) = .
Пример. Найти доверительный интервал для математического ожидания нормально распределенной случайной величины Х, для которой по выборке объема n = 25 найдены =2,4 и =4, если надежность γ = 0,95. Решение. I способ: t = t(0,95; 25) ≈ 2,064 (по таблицам значений функции Стьюдента). - = 2,4 – ≈ 1,57; + ≈ 3,23 (1,57; 3,23) – доверительный интервал.
II способ: Ф(t) = 0,475 => t ≈ 1,96 => (1,62; 3,18) – доверительный интервал.
Таблица значений функции t = t (γ; n)
γ n | 0,95 | 0,99 | 0,999 |
2,78 | 4,60 | 8,61 | |
2,57 | 4,03 | 6,86 | |
2,45 | 3,71 | 5,96 | |
2,37 | 3,50 | 5,41 | |
2,31 | 3,36 | 5,04 | |
2,26 | 3,25 | 4,78 | |
2,23 | 3,17 | 4,59 | |
2,20 | 3,11 | 4,44 | |
2,18 | 3,06 | 4,32 | |
2,16 | 3,01 | 4,22 | |
2,15 | 2,98 | 4,14 | |
2,13 | 2,95 | 4,07 | |
2,12 | 2,92 | 4,02 | |
2,11 | 2,90 | 3,97 | |
2,10 | 2,88 | 3,92 | |
2,093 | 2,361 | 3,883 | |
2,064 | 2,797 | 3,745 | |
2,045 | 2,756 | 3,659 | |
2,032 | 2,720 | 3,600 | |
2,023 | 2,708 | 3,558 | |
2,016 | 2,692 | 3,527 | |
2,009 | 2,679 | 3,502 | |
2,001 | 2,662 | 3,464 | |
1,996 | 2,649 | 3,439 | |
1,001 | 2,640 | 3,418 | |
1,987 | 2,633 | 3,403 | |
1,984 | 2,627 | 3,392 |