Интервальные оценки. Точность и надежность оценок
При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т. е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками. Интервальной называют оценку, которая определяется двумя числами — концами интервала.
Пусть по данным выборки для оценки параметр известного распределения генеральной совокупности подобрана статистика
. Заменяя неизвестное значение
числом
, мы совершаем ошибку. Тогда случайная величина
– абсолютное значение ошибки. Если d>0 и |q–
|<d, то чем меньше d, тем оценка точнее. Таким образом, положительное число d характеризует точность оценки. Однако статистические методы не позволяют категорично утверждать, что оценка
удовлетворяет неравенству |q–
|<d; можно лишь говорить о вероятности g, скоторой это неравенство осуществляется. Если известен закон распределения случайной величины
, то эту вероятность можно найти
. Если для небольших d вероятность g достаточно велика, то число
можно считать точной и надежной оценкой неизвестного параметра
.
Надежностью (доверительной вероятностью) оценки q по называют вероятность g, с которой осуществляется неравенство |q—
|<d. Обычно надежность оценки задается наперед, причем в качестве g берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.
Пусть .
Заменив неравенство |q – | < d равносильным ему двойным неравенством – d<q—
< d, или
– d<q <
+ d, имеем
Это соотношение следует понимать так: вероятность того, что интервал ( – d,
+ d) заключает в себе (покрывает) неизвестный параметр q, равна g.
Доверительным называют интервал ( – d,
+ d), который покрывает неизвестный параметр с заданной надежностью g.
2.4. Доверительный интервал для оценки математического ожидания нормально распределенной генеральной совокупности, когда дисперсия s2 генеральной совокупности известна
Рассмотрим случайную величину – выборочное среднее:
.
Так как генеральная совокупность распределена по нормальному закону, тоже имеет нормальное распределение,
,
. Рассмотрим интервал
, или
. Ширину
этого интервала определим из условия
, где g – заданная доверительная вероятность.
Можно показать, что в этом случае , где число t определяется из таблицы функции Лапласа из условия
.
Таким образом, получаем
.
Смысл полученного соотношения таков: с надежностью g можно утверждать, что доверительный интервал покрывает неизвестный параметр а.
Замечание 1. Оценку называют классической. Из формулы
можно сделать следующие выводы:
1) при возрастании объема выборки п число d убывает и, следовательно, точность оценки увеличивается;
2) увеличение надежности оценки g = 2Ф(t) приводит к увеличению t (Ф (t) – возрастающая функция), следовательно, и к возрастанию d; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.
Замечание 2. Когда объем выборки при построении доверительного интервала для a можно пользоваться нормальным распределением, подставляя в формулу для ширины интервала вместо неизвестного значения s число s, определяемое по выборке.
Замечание 4. Оценка истинного значения измеряемой величины. Пусть производится п независимых равноточных измерений некоторой физической величины, истинное значение а которой неизвестно. Будем рассматривать результаты отдельных измерений как случайные величины . Эти величины независимы (измерения независимы), имеют одно и то же математическое ожидание а (истинное значение измеряемой величины), одинаковые дисперсии
2 (измерения равноточны) и распределены нормально (такое допущение подтверждается опытом). Таким образом, все предположения, которые были сделаны при выводе доверительных интервалов в предыдущих параграфах, выполняются, и, следовательно, мы вправе использовать полученные в них формулы. Другими словами, истинное значение измеряемой величины можно оценивать по среднему арифметическому результатов отдельных измерений при помощи доверительных интервалов.