Последовательные испытания. формула бернулли.
Предположим, что производится n независимых испытаний, в результате каждого из которых может наступить или не наступить некоторое событие A. Пусть при каждом испытании вероятность наступления события А равна P(A)=p и, следовательно, вероятность противоположного события (ненаступления А) равна . Определим вероятность Pn(m) того, что событие А произойдетm раз при n испытаниях. При этом заметим, что наступления или ненаступления события А могут чередоваться различным образом. Условимся записывать возможные результаты испытаний в виде комбинаций букв А и . Например, запись означает, что в четырех испытаниях событие осуществилось в 1-м и 4-м случаях и не осуществилось во 2-м и 3-м случаях.
Всякую комбинацию, в которую А входит m раз и входит n-m раз, назовем благоприятной. Количество благоприятных комбинаций равно количеству k способов, которыми можно выбрать m чисел из данных n; таким образом, оно равно числу сочетаний из n элементов по m, т.е.
Подсчитаем вероятности благоприятных комбинаций. Рассмотрим сначала случай, когда событие A происходит в первых m испытаниях и, следовательно, не происходит в остальных n-m испытаниях. Такая благоприятная комбинация имеет следующий вид:
Вероятность этой комбинации в силу независимости испытаний (на основании теоремы умножения вероятностей) составляет
Так как в любой другой благоприятной комбинации Вi событие A встречается также m раз, а событие происходит n-m раз, то вероятность каждой из таких комбинаций также равна . Итак
Все благоприятные комбинации являются, очевидно, несовместными. Поэтому (на основании аксиомы сложения вероятностей)
Следовательно,
(13) |
или, так как | , то |
(13') |
Формула (13) называется формулой Бернулли *.
Пример 1. Вероятность попадания в цель при одном выстреле равна 0,6. Какова вероятность того, что 8 выстрелов дадут 5 попаданий?
Решение: Здесь
n=8;
m=5;
p=0,6;
q=1-0,6=0,4.
Используя формулу (13'), имеем
Пример 2. Определить наивероятнейшее число попаданий в цель в примере 1.
Решение: Здесь
n=8;
p=0,6;
q=0,4;
np-q=8*0,6-0,4=4,4;
np+p=8*0,6+0,6=5,4.
Согласно формуле (14) наивероятнейшее значение лежит на сегменте [4.4;5.4] и, следовательно равно 5.
8.
Теорема Пуассона ~ Локальная теорема Муавра-Лапласа ~ Интегральная теорема Муавра-Лапласа ~ Теорема Бернулли
Теорема Пуассона. При большом количестве испытаний вычисления по формуле Бернулли становятся затруднительными. Однако в ряде случаев их можно заменить более простымиасимптотическими формулами. Одна из них основана на теореме Пуассона.
Если число испытаний n ® и p ® 0 так, что np ® l , l > 0, то
при любых k = 0, 1, 2, … .
Это означает, что при больших n и малых p вместо вычислений по точной формуле
можно воспользоваться приближенной формулой
.
На практике пуассоновским приближением пользуются при npq= np(1-p)< 9. Исследуем точность асимптотической формулы Пуассона на следующем примере.
ПРИМЕР 1. Точность формулы Пуассона.
В здании 1000 лампочек. Вероятность выхода из строя одной лампочки в течение года p=0.003. Найдем вероятность того, что в течение одного года выйдет из строя более трех ламп. Выполним вычисления используя формулу Бернулли и по теореме Пуассона.
Для вычисления вероятности по формуле Бернулли используем формулу
P(x > 3) = 1- P(x 3) = 1- Fx (3),
где Fx (x) - функция распределения для биномиального распределения.
Для вычисления вероятности по теореме Пуассона используем формулу
P(m > 3) = 1- P(m 3) = 1- Fm (3),
где Fm (x) - функция распределения Пуассона с параметром l = np = 3.
Выполним те же вычисления для p = 0.3 и n = 10 (l = np =3).
Локальная теорема Муавра-Лапласа. Если npq > 9, то для расчетов используют приближение Муавра-Лапласа
,
где 0 < p < 1 , величина ограничена при n ® .
Требование ограниченности величины xk означает, что при n ® величина
k тоже должна расти вместе с величиной n. Точность формулы
растет, как с ростом величин n и k, так и по мере приближения к 0.5 величин p и q.
Исследуем точность асимптотической формулы Муавра-Лапласа на следующем примере.
ПРИМЕР 2. Точность формулы Муавра-Лапласа.
Вычислим вероятность того, что случайная величина, имеющая биномиальное распределение, принимает значение, равное n/2 . Выполним вычисления для n = 10, 20, 50. Сравним результаты вычислений по формуле Бернулли и по приближенной формуле Муавра-Лапласа.
Интегральная теорема Муавра-Лапласа. При n ® для схемы Бернулли при любых a и bсправедлива формула
.
Отсюда следует, что вероятность того, что число успехов в n испытаниях Бернулли заключено между k1 и k2, можно вычислить по формуле
,
где , , - функция Лапласа.
Точность этой приближенной формулы растет с ростом n. Если значение npq сравнительно невелико, то лучшее приближение дает формула
,
и для вычисления вероятности того, что число успехов в n испытаниях Бернулли заключено между k1 и k2, можно использовать формулу
,
где , .
ПРИМЕР 3. Точность интегральных формул Муавра-Лапласа.
Вероятность рождения мальчика p = 0.51, а девочки - q = 1 - p = 0.49. Найдем вероятность того, что среди 10 000новорожденных мальчиков будет не менее 4 000 и не более 5000. Вычисления проведем по формуле Бернулли и по приближенным интегральным формулам Муавра-Лапласа.
Теорема Бернулли. Если x - число успехов в n испытаниях Бернулли с вероятностью p успеха в одном испытании, то для любого e > 0 справедливо
.
Это означает, что с ростом числа испытаний n относительная частота успехов x /nприближается к вероятности p успеха в одном испытании.
Определим, сколько нужно произвести испытаний, чтобы с вероятностью, больше или равнойb, отклонение относительной частоты успехов x /n от вероятности p было меньше e . Т.е. найдем n, для которого выполняется неравенство
.
Доказано, что для числа n, которое обеспечивает выполнение этого неравенства, справедливо
,
где xb - решение уравнения .
Следует обратить особое внимание на замечательный факт - искомое значение n не зависит от p!
ПРИМЕР 4. Производитель утверждает, что вероятность отрицательного отношения покупателя к новому товару невелика. Сколько нужно опросить человек, чтобы с вероятностью не менее 0.9 можно было утверждать, что относительная частота отрицательного отношения к новому товару отличается от заявленной производителем не более, чем на 0.01.
14.
Определение независимых величин
По известному совместному распределению двумерной случайной величины нетрудно найти распределения его компонент. Решить обратную задачу, т.е. восстановить совместное распределение (x , h ) по известным распределениям величин x и h , вообще говоря, невозможно. Однако эту задачу можно решить, когда случайные величины x и hн е з а в и с и м ы.
Случайные величины называются независимыми, если для любых x1, x2 R2
.
Независимые непрерывные величины
Для непрерывных случайных величин это определение эквивалентно такому:
случайные величины называются независимыми, если
во всех точках непрерывности входящих в это равенство функций.
ПРИМЕР 1. Найдем распределение компонент непрерывного двумерного случайного вектора и проверим их независимость.
Независимые дискретные величины
Для дискретных случайных величин x и h с матрицей совместного распределения {pij} условие независимости x и h имеет вид:
,
для всех i = 1, 2, …, n; j = 1, 2, …, m.
В частности, случайные величины x и h , заданные совместным распределением
0.1 | 0.1 | |
0.1 | 0.2 | |
0.2 | 0.3 |
зависимы, поскольку p11 = 0.1, а px 1ph 1 = (0.1+0.1)*(0.1+0.1+0.2) = 0.2*0.4 = 0.08.
В то же время в совместном распределении x и h
0.08 | 0.12 | |
0.12 | 0.18 | |
0.20 | 0.30 |
величины x и h н е з а в и с и м ы.
Корреляция
Понятно, что значение ковариации зависит не только от “тесноты” связи случайных величин, но и от самих значений этих величин, например, от единиц измерения этих значений.
Для исключения этой зависимости вместо ковариации используется коэффициент корреляции .
Этот коэффициент обладает следующими свойствами:
он безразмерен;
его модуль не превосходит единицы, т.е. ;
если и независимы, то (обратное, вообще говоря неверно!);
если , то случайные величины и связаны функциональной зависимостью вида , где и — некоторые числовые коэффициенты;
;
Корреляционной матрицей случайного вектора называется матрица
.
Если и , то ковариационная и корреляционная матрицы случайного вектора связаны соотношением
,
где .
Распределение двумерной случайной величины
Распределение случайной величины x
Математическое ожидание x
Распределение случайной величины h
Математическое ожидание h
Распределение и математическое ожидание xh
Ковариация xh
Дисперсия x | Дисперсия h |
Дисперсия x+h
Распределение x+h