Закон больших чисел в форме Чебышева
На практике хорошо известна следующая закономерность, которую можно сформулировать так: среднее арифметическое большого числа независимых однотипных случайных факторов практически неслучайно. Например, среднее арифметическое большого числа измерений одной и той же величины практически не отличается от истинного значения этой величины; средняя кинетическая энергия большого числа хаотически движущихся молекул практически неслучайна и характеризует температуру тела.
Методы теории вероятностей позволяют дать строгую математическую формулировку этого закона.
Пусть имеется бесконечная последовательность случайных величин
x1, x2, … , xn, … (29)
Будем кратко называть случайные величины (29) однотипными, если они имеют одно и тоже математическое ожидание а и одну и туже дисперсию D.
Теорема.Пусть случайные величины (29) однотипны и независимы, тогда имеет место соотношение
при n ® ¥, (30)
где а = М [xk], k = 1, 2, …, e – любое как угодно малое положительное число.
Это означает: при достаточно большом n с практической достоверностью (с вероятностью » 100%) выполняется равенство
.
Эта теорема впервые была доказана русским математиком П.Л. Чебышевым. Доказательство теоремы основано на трех леммах.
Лемма 1. Пусть случайная величина h≥ 0. Тогда справедливо неравенство
Р (h≥ D) ≤ , (31)
где D – любое положительное число.
Доказательство проведем для непрерывной случайной величины. Плотность вероятности случайной величины h f (х) = 0 при х < 0, так как h≥ 0.
По определению математического ожидания имеем:
≥ ≥
(h≥ D),
откуда следует неравенство (31).
Лемма 2. Пусть x – случайная величина с числовыми характеристиками (а, D), тогда справедливо неравенство:
Р (| x – a| <e ) ≥ 1 – .
Доказательство. Имеем
Р (| x – a| ≥ e ) = P ((x – a)2 ≥ e 2) ≤ .
Здесь использовано неравенство (31) при h = (x – a)2, D = e 2.
Из полученного неравенства следует
Р (| x – a| <e ) = 1 – Р (| x – a| ≥ e ) ≥ 1 – .
Лемма 3. Пусть x1, x2, …, xn - независимые однотипные случайные величины с числовыми характеристиками (а, D). Тогда при любом e>0справедливо неравенство
≥ 1 – . (32)
где e – любое положительное число, a = M [xi], D = D [xi], i = 1, 2, …, n..
Неравенство (32) называется неравенством Чебышева.
Доказательство. Обозначим
.
Из свойств математического ожидания и дисперсии для независимых случайных величин следует:
Таким образом, случайная величина имеет числовые характеристики ; применяя к ней лемму 2, получим требуемое неравенство (32).
Доказательство теоремы Чебышева.
В силу неравенства Чебышева (32) имеем при любом n двойное неравенство
1 ≥ ≥ 1 – .
Переходя к пределу при n ® ¥ и учитывая теорему сравнения из теории пределов, получим требуемое соотношение (30).
Замечание. Введем удобный термин. Пусть имеется последовательность случайных величин
h1, h2, …, hn, … . (33)
Говорят, что последовательность (33) сходится по вероятности к неслучайной величине а и пишут
при n ® ¥,
если для любого e > 0 выполняется соотношение
Р (| hn – a| <e ) ® 1 при n ® ¥.
Очевидно, теорема Чебышева может быть сформулирована так: среднее арифметическое независимых однотипных случайных величин при неограниченном увеличении числа слагаемых сходится по вероятности к их общему математическому ожиданию.
Пример. Сколько надо провести независимых равноточных измерений данной величины, чтобы с вероятностью не менее 0,95 гарантировать отклонение среднего арифметического этих измерений от истинного значения величины не более, чем на 1 (по абсолютной величине), если СКО каждого измерения не превосходит 5?
Решение. Пусть xi – результат i-го измерения (i = 1,2,…, n), a – истинное значение измеряемой величины, то есть M [xi] = a при любом i; с учетом равноточности измерений xi имеют одинаковую дисперсию D ≤ 25. В силу независимости измерений xi – независимые случайные величины.
Необходимо найти n, при котором
≥ 0,95.
В соответствии с неравенством Чебышева (32) данное неравенство будет выполняться, если
1 – ≥ 1– ≥ 0,95, откуда легко найти
n ≥500 измерений.
Теорема Бернулли
В начале курса теории вероятностей было сформулировано: вероятность случайного события есть доля наступления этого события в длинной серии независимых одинаковых испытаний. Укажем строгую математическую формулировку этого утверждения.
Пусть выполняется серия n независимых одинаковых испытаний и при каждом испытании событие А наступает с вероятностью р (схема Бернулли). Обозначим
Wn = | число наступлений события А | . |
n |
Число Wn называется частотой события А в серии из n испытаний.
Теорема. В указанной ситуации при неограниченном возрастании числа независимых испытаний частота случайного события А сходится по вероятности к вероятности этого события:
при n ® ¥.
Доказательство. Очевидно, Wn – случайная величина, при этом справедливо равенство
, где
xi – число наступлений события А в i -ом испытании.
Проверим, что случайные величины xi удовлетворяют условиям теоремы Чебышева.
1. x1, x2, … , xn независимы в силу независимости испытаний.
2. Закон распределения случайной величины xi для всех i = 1, …, n имеет вид
xi = , q = 1 – p. (34)
Отсюда
M [xi] = p · 1 + 0 · q = p,
D [xi] = p (1 – p)2 + q (0 – p)2 = pq. (35)
Следовательно, случайные величины xi однотипны с числовыми характеристиками: а = р, D = pq.
В силу теоремы Чебышева среднее арифметическое этих случайных величин сходится по вероятности к их общему математическому ожиданию:
при n ® ¥,
что и требовалось.
Замечание 1. Из сказанного выше следует: число успехов (наступлений события А в схеме Бернулли) дается формулой
x=x1+ x2+ … + xn, (36)
где xI – число успехов в i-ом испытании.
Из (35), (36) следует:
M [x] = n p, D [x] = npq. (37)
Таким образом, числовые характеристики биномиальной случайной величины с параметрами (n, p) даются формулами (37).
Замечание 2. Индикатором связанного с испытанием события А называется случайная величина, равная 1, если событие А произойдет и 0, если событие А не произойдет. Очевидно, закон распределения индикатора имеет вид (34), где р – вероятность наступления, q – вероятность ненаступления события А.