Интервальная оценка вероятности события
"Хорошей" точечной оценкой вероятности р события А является частость , где n - общее число испытаний, а событие А может произойти с вероятностью р или не произойти с вероятностью q=1-p(последовательность испытаний Бернулли).
Интервальная оценка для р задается в виде
P(p1<p<p2)=1-α,
где (p1, p2) - границы интервала для вероятности р, отвечающие надежности 1-α, α - уровень значимости.
Интервальная оценка зависит от объема выборки n.
Интервальная оценка вероятности для большого числа испытаний Бернулли. Так как А - случайное событие, то m - число появлений А в n испытаниях - тоже случайно.
При выполнении условий (грубых), что n порядка нескольких десятков, а np>10, распределение величины m в силу локальной и интегральной теорем Муавра-Лапласа близко к нормальному распределению с математическим ожиданием, равным np, и дисперсией, равной npq, т. е.
.
При делении m на n его распределение не изменяется, изменяются только его параметры. Поэтому при большом n распределение частости , так же как и распределение частоты m, близко к нормальному, но с математическим ожиданием
(2.45) |
и дисперсией
. | (2.46) |
Таким образом, при большом числе n испытаний Бернулли и распределение величины близко к нормальному с нулевым математическим ожиданием и нулевой дисперсией.
Из условия
(2.47) |
определяются границы в виде
; | (2.48) |
. | (2.49) |
Отсюда получается, что частость определяет значение неизвестной вероятности с точностью
.
Интервальная оценка вероятности при малом числе n испытаний Бернулли
Законом распределения числа Х события А в n испытаниях в данном случае является биномиальный закон распределения, т. е. вероятность
При доверительной вероятности вероятность
P = (p1 < p < p2) = γ. | (2.50) |
Так как при p≠0.5 и n малом биномиальное распределение несимметрично, то в качестве доверительного интервала для р берут такой интервал (p1,p2), что вероятность попадания левее p1 и правее p2 одна и та же и равна :
(2.51) |
где - фактическое число элементов выборки, обладающих интересующим признаком.
Решение таких уравнений упрощается, если использовать таблицы для нахождения p1 и p2 по заданным n, n-m, γ.
Определение объема выборки
Выбор совок-тью или просто выборкой, наз. совок-ть случ отобр объектов. Ген. совок-тью наз. совок-ть объектов, из кот. произв-ся выборка. Объемом совок-ти (выборочной или генеральной) наз. число объектов этой совок-ти. При составл выб можно поступать двояко: после того, как объект отобран и над ним произвед наблюд, он может быть возвр, либо не возвр в ген. совок-ть. В соот-вии с этим, выборки подраздел на повторн и бесповторн.
Для опред необх объема выборки, при кот с заданн вер-ю γ можно утвержд, что выборочн средняя отлич-ся от генерального по абсолютн величине меньше чем на δ, используют формулы:
а) в случае известной дисперсии: n=(tγ2σ2)/δ2, где Ф(tγ)= γ
б) в случае неизвестн дисперсии организуют специальную «пробную» выборку небольш объема, находят оценку S2, и полагая, что σ2≈S2 , находят объем «основной» выборки: n=(tγ2S2)/δ2