Интервальное оценивание параметров
Точечные оценки неизвестного параметра хороши в качестве первоначальных результатов обработки наблюдений. Их недостаток в том, что неизвестно, с какой точностью они дают оцениваемый параметр. Для выборок небольшого объема вопрос о точности оценок очень существенен, так как между и может быть большое расхождение в этом случае. Кроме того, при решении практических задач часто требуется определить и надежность этих оценок. Тогда и возникает задача о приближении параметра не одним числом, а целым интервалом .
Оценка неизвестного параметра называется интервальной, если она определяется двумя числами - концами интервала.
Задачу интервального оценивания можно сформулировать следующим образом: по данным выборки построить числовой интервал , относительно которого с заранее выбранной вероятностью можно сказать, что внутри этого интервала находится точное значение оцениваемого параметра.
Интервал , в который с заданной вероятностью попадает истинное значение параметра , называется доверительным интервалом, а вероятность - надежностью оценки или доверительной вероятностью.
Величина выбирается заранее, ее выбор зависит от конкретно поставленной задачи. Так, степень доверия авиапассажира к надежности самолета, должна быть выше степени доверия покупателя к надежности телевизора. Надежность принято выбирать равной 0,9; 0,95; 0,99 или 0,999.
Доверительный интервал для оценки математического ожидания случайной величины с заданной надежностью в случае нормального распределения при известной дисперсии определяется на основе неравенств:
,
то есть это интервал
,
где - значение аргумента функции Лапласа, получаемое из таблиц, с учетом того, ;
известное среднее квадратическое отклонение или его оценка;
объем выборки.
Пример 12. Для проведения статистического исследования отобрано 25 промышленных предприятий отрасли. Средняя стоимость основных фондов предприятий оказалась равной 37 млн. руб. Предположим распределение стоимости основных фондов предприятий отрасли нормальным со средним квадратическим отклонением , найти доверительный интервал для оценки математического ожидания с надежностью 0,95.
Решение.
Учитывая, что и , находим значение функции . По таблице значений функции Лапласа находим: . Тогда . Следовательно, согласно формуле доверительный интервал для математического ожидания будет:
;
;
.
Таким образом, с вероятностью 0,95 можно утверждать, что средняя стоимость основных фондов промышленных предприятий принадлежит интервалу: .
Для получения оценки математического ожидания нормально распределенной случайной величины при неизвестной дисперсии следует воспользоваться неравенством:
,
то есть это интервал
,
где исправленное среднее квадратическое отклонение случайной величины , вычисленное по выборке: ;
находится по таблице квантилей распределения Стьюдента в зависимости от доверительной вероятности и числа степеней свободы .
Пусть - нормально распределенная случайная величина с параметрами . Пусть неизвестно, задана. Можно показать, что если математическое ожидание известно, то доверительный интервал для среднего квадратического отклонения имеет вид:
,
где объем выборки, , а
;
являются квартилями распределения с степенями свободы, определяемые по таблице квартилей .
Если математическое ожидание неизвестно, то доверительный интервал для неизвестного имеет вид:
,
где - исправленное среднее квадратическое отклонение, квантили
;
определяются по таблице при и соответственно.
Пример 13. Для оценки параметра нормально распределенной случайной величины (средняя месячная зарплата работников предприятия, тыс. руб.)была сделана выборка объемом 30 единиц и вычислено исправленное среднее квадратическое отклонение . Найти доверительный интервал, покрывающий с вероятностью .
Решение.
Имеем , . По таблице находим:
,
.
Доверительный интервал имеет вид:
или .
Таким образом с вероятностью 0,9 можно утверждать, что среднее квадратическое отклонение заработной платы работников данного предприятия принадлежит интервалу .