Построение доверительного интервала
Тема: Интервальные оценки генеральных параметров. Погрешности измерений.
Основные понятия.
Интервальной оценкой называют оценку, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надёжность точечной оценки.
Пусть q* – точечная оценка неизвестного параметра q, являющаяся случайной величиной. Чем меньше ½q -q*½, тем точнее q* определяет параметр q. Если e > 0 и ½q -q*½ < e, то чем меньше e, тем точнее оценка. Число e называется точностью оценки.
В силу случайности q* можно лишь говорить о вероятности осуществления неравенства ½q - q*½<e.
Надёжностью (доверительной вероятностью) оценки q* называют вероятность g, с которой осуществляется неравенство ½q - q*½ < e. Обычно g = 0,95; 0,99; 0,999…
Запись Р{q*-e <q <q*+ e}=g означает, что вероятность того, что интервал (q*-e;q*+e) заключает в себе неизвестный параметр q, равна g:
Вероятность того, что неизвестный параметр не попадёт в интервал ½q-q*½<e, равна 1-g = a (уровень значимости).
Построение доверительного интервала.
Существует два подхода к построению доверительного интервала:
1) для каждого конечного объёма выборки n
2) асимптотический подход при достаточно больших объёмах выборки
Рассмотрим основные положения первого подхода. Данный метод построения доверительного интервала основан на подборе функции y(q, q*), называемый статистикой.
Статистика должна обладать следующими свойствами:
1`известен закон распределения (хотя бы приближённо) для статистики;
2`закон распределения не зависит от q;
3`статистика y(q, q*) непрерывна и строго монотонна по q;
4`задавшись доверительной вероятностью 1–a, находят критические границы и , т.е. с вероятностью 1–a выполняется неравенство <y(q,q*)< ;
5`решив последнее неравенство относительно q, находят границы доверительного интервала.
Асимптотический подход более универсален, т.к. в общем случае дисперсия оценки q* зависит от оцениваемого параметра q:
D(q*) »
1`поэтому необходимо преобразование q* в g(q*) так, чтобы дисперсия D(g(q*)) не зависела от q:
D(g(q*)) » [g`(q)]2 D(q*) » [g’(q)]2 = =const(q)
Это возможно, если С(q)g’(q)=1.
2`вычислим функцию g(q):
g’(q)= или g(q)= .
3`при больших п распределение g(q*) близко к нормальному. Нормированная величина Z= имеет приближённо (асимптотически) распределение N(0;1). Таким образом, при больших п с вероятностью 1 – a имеет место неравенство:
<Ua
где Ф(Ua)= – функция Лапласа. Окончательно имеем:
g(q*)– <g(q)<g(q*)+
4`разрешив это неравенство относительно q, получим доверительный интервал для неизвестного параметра, использовав при этом обратную функцию g-1(q).