Доверительный интервал. Доверительная вероятность.
Ранее был рассмотрен вопрос об оценке неизвестного параметра а. Причем оценка была дана в виде некоторого значения . Эта оценка называется точечной. В большинстве задач требуется не только найти для параметра а подходящее численное значение, но и оценить его точность и надежность.
Чтобы дать представление о точности и надежности оценки , используются так называемые доверительные интервалы и доверительные вероятности.
Пусть для параметра а получена из опыта несмещенная оценка . Оценим возможную при этом ошибку. Назначим некоторую достаточно большую вероятность b (например 0,9; 0,95 или 0,99) такую, что событие с вероятностью b можно считать практически достоверным и найдем такое значение e, для которого:
. (*)
Тогда диапазон практически возможных значений ошибки, возникающей при замене а на будет . Большие по абсолютной величине ошибки будут появляться лишь с малой вероятностью . Зависимость (*) можно записать в виде:
. (**)
Равенство (**) означает, что с вероятностью b неизвестное значение параметра а попадает в интервал . В данном случае величина а не случайна, но случаен интервал . Случайно его положение на оси абсцисс, определяемое его центром , случайна и длина интервала , т.к. величина e вычисляется как правило по опытным данным. Поэтому b следует толковать не как вероятность попадания точки а в интервал , а как вероятность того, что случайный интервал накроет а. Вероятность b называют доверительной вероятностью, а интервал – доверительным интервалом. Границы интервала : , называются доверительными границами (рис. 2.16).
Рис. 2.16
Определим доверительные границы. Пусть для параметра а имеется несмещенная оценка . Если бы закон распределения был известен, то доверительные границы определились решением уравнения:
.
Но закон распределения оценки зависит от закона распределения самой величины X, а следовательно от его неизвестных параметров, в том числе и от самого параметра a.
Чтобы обойти это затруднение при нахождении доверительных границ вместо параметров закона распределения оценки приходится использовать их точечные оценки. При сравнительно большом числе опытов этот прием дает сравнительно неплохой результат. В качестве примера рассмотрим задачу о доверительном интервале для математического ожидания. Пусть произведено n независимых опытов над случайной величиной X, характеристики которой – математическое ожидание m и дисперсия D – неизвестны.
Для этих параметров получены оценки, и в частности для математического ожидания .
Требуется построить доверительный интервал , соответствующий доверительной вероятности b для математического ожидания m величины X.
При решении этой задачи воспользуемся тем, что величина представляет собой сумму n независимых одинаково распределенных случайных величин при достаточно большом n, а потому закон ее распределения будет близок к нормальному. Т.о. можно считать, что величина распределена по нормальному закону, характеристики, которого соответственно равны m и . Тогда:
Для определения необходимо решить уравнение:
или .
Его решение , где – функция обратная , ее удобно получить с помощью таблиц обратных функций Отсюда зная и (здесь приходится использовать ее точечную оценку ), определяется :