Элементы теории вероятности
В окружающем нас мире часто приходится сталкиваться с явлениями и фактами, которые при различных условиях могут происходить, а могут не происходить. Такие явления и факты называются случайными событиями. Понятие случайного события связано с единичными явлениями или их небольшим числом. При рассмотрении большого- числа явлений обнаруживаются определенные закономерности (рождаемость 515 мальчиков из 1000, выпадение 6 на игральной кости, вес и рост детей и т.д.).
Изучение закономерностей однородных массовых случайных явлений и составляет предмет теории вероятности и основанной на ней математической статистики.
Методы теории вероятности и математической статистики нашли широкое применение при обработке данных экспериментов в различных областях науки и техники, в том числе и медицине. Например, при оценке заболеваемости, смертности, количества несчастных случаев, в медицинской диагностике, организации здравоохранения и др.
Изучение каждого отдельного явления с выполнением некоторого определенного комплекса условий называется испытанием.
Всякий результат или исход испытания называется событием.
События принято обозначать заглавными буквами латинского алфавита А, В, С,...
Возможность появления каждого события определяется специальной величиной, вероятностью наступления события - Р(А). Есть два способа определения вероятности.
1. Пусть из N выниманий шара из урны с разноцветными шарами (с возвращением их обратно) было извлечено М белых шаров. М - называют частотой наступления событий, отношение M/N - частостью или относительной частотой. При небольшом количестве испытаний частость может принимать довольно различные значения в различных сериях опытов. При значительном числе испытаний частость принимает практически устойчивое значение.
Вероятностью случайного события называется предел, к которому стремится частость при неограниченном увеличении числа испытаний.
Р(А) = limN→∞ M/N
Это статистическое определение вероятности.
2. Поставим задачу: определить вероятность выпадения 6 при бросании игральной кости. При однократном бросании игральной кости все события (выпадение 1, 2, 3,....) являются равновозможными, единственно возможными и несовместимыми. События называются несовместимыми, если в условиях испытания каждый раз возможно появление одного из них.
Под вероятностью наступления события понимается отношение числа исходов, благоприятствующих наступлению данного события, к числу всех несовместимых, единственно возможных и равновозможных исходов испытания.
Это классическое определение вероятности. В общем виде P (A) = m/n,
где m - число благоприятствующих событий, n - число всех возможных событий при однократном испытании. В нашем примере Р(А)=1/6. Следует подчеркнуть, что 0< Р(А)<1, причем, если Р = 0, то событие невозможно, если Р = 1, то такое событие называется достоверным. Величина вероятности наступления одного из случайных событий предсказывает возможность его появления при конкретном испытании. Например, появление первого белого шара при однократном извлечении из урны с разноцветными шарами, диагноз заболевания у конкретного больного и т.д. На практике часто возникает необходимость определения вероятности наступления двух или более несовместимых событий; не важно какого, при однократном испытании. Например, выпадение на верхней грани игральной кости четного чирла. Ответ на этот вопрос дает теорема сложения вероятностей.
Вероятность появления одного (безразлично какого) события из нескольких несовместимых событий равна сумме вероятностей этих событий
Р (А или В или С...) = Р (А) + Р (В) + Р (С) + ...
В приведенном примере вероятность выпадения четного числа на верхней грани игральной кости
Р (2 или 4 или 6) = Р (2) + Р (4) + Р (6) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2;
Вероятность одновременного появления двух или более независимых событий равна произведению вероятностей каждого из них.
Р (А и В и С)= Р (А) * Р (В) * Р (С)
Это теорема произведения вероятностей.
Пример. Найдите вероятность того, что в семье из трех детей родятся два сына и одна дочь.
Вероятность рождения мальчика Р(А) = 0,515, вероятность рождения девочки Р(В) = 0,485.
Р (А и В и С) = Р (А) * Р (В) * Р (С) = 0,515 * 0,515 * 0,485 = 0,129
Рассмотрим простую задачу из теории игр. Из урны ,в которой среди 10 шаров, имеется 6 белых, извлекают последовательно шары, не возвращая их обратно. Определить вероятность того, что второй извлеченный шар окажется белым .Вероятность извлечения первого белого шара Р(А)= 6/10. А вероятность извлечения второго белого шара зависит от того, имело ли первое событие место. Если первым был белый шар, то вероятность извлечения второго белого шара равна Р(В)=5/9. Если первый шар не белый, то Р(В)=6/9. Таким образом, вероятность наступления второго события зависит от первого события. Такая вероятность наступления события называется условной вероятностью и обозначается РА(В) - если первое событие имело место, Р-A(В) - если первое событие не имело место. А - событие противоположное событию А.
Сумма вероятностей всех возможных событий при данном испытании равна 1:
Р(А)+Р(В)+Р(С) +... = 1
Изучая какое-либо явление, мы всегда имеем дело с совокупностью величин, описывающих его. Эти величины даже для одного и того же явления несколько изменяются, варьируют в различных измерениях. Особенно это положение относится к области биологии и медицины, где эти изменения могут быть весьма существенными, т.к. развитие живого организма определяется очень многими и разнообразными условиями внутреннего и внешнего порядка. Поэтому, в результате изучения у ряда особей какого-либо качественного или количественного признака будет получаться не одно, а целый ряд значений, обычно не совпадающих между собой.
Такие величины, которые в зависимости от обстоятельств могут принимать те или иные значения, называются случайными величинами. Случайная величина, принимающая только определённые числовые значения, называется дискретной.
Например: оценка, полученная на экзамене - 2, 3, 4, 5, номера выигрышных билетов в лотерее, число форменных элементов в крови, количество заболеваний и др.
Случайные величины обозначаются X, Y, Z, ..., а их возможные значения – х1, х2, х3,..., хi,... хn; у1, у2, у3,... ,yi;... уn.
Представление возможных значений дискретной случайной величины и соответствующих им вероятностей называют законом или функцией распределения случайной величины.
Закон или функция распределения могут быть заданы графически, аналитически, в виде таблицы. На практике дискретные случайные величины характеризуются числовыми параметрами, связанными с законом распределения. Это математическое ожидание, дисперсия, среднее квадратичное отклонение.
Математическим ожиданием случайной величины называется сумма произведений всех её возможных значений на их вероятности.
М(Х) = ∑ xiPi
Отдельные значения случайной величины группируются около математического ожидания. Степень рассеивания характеризуется дисперсией.
Дисперсией называется математическое ожидание квадрата отклонения случайной величины от её математического ожидания.
D(X) = M[xi - M(X)]2
Можно доказать, что D(X) = ∑ Рi [хi - М (X)]2
Средним квадратичным отклонением случайной величины называется корень квадратный из дисперсии.
σ(X) = (D(X))1/2
Математическое ожидание и среднее квадратичное отклонение определяют интервал, внутри которого находится истинное значение измеряемой величины.
хист = M(Х) ± tσ(Х)
Величина, принимающая любые значения в определенном интервале, называется непрерывной.
Например: мгновенные значения скорости теплового движения молекул, температура тела человека, процентное содержание кислорода в воздухе, плотность воздуха в зависимости от высоты над поверхностью земли и др. Для непрерывной величины характерны те же параметры, что и для случайной — М(Х), D(X), o(X). Т.к. невозможно перечислить все значения непрерывной случайной величины и указать их вероятности, то промежуток между крайними значениями делят на определенное количество интервалов и определяют вероятность того, что те или иные значения её попадают в эти интервалы.
Такую функцию распределения непрерывной случайной величины называют плотностью вероятности.
φ (X) = Р (α< X <β)
В качестве примера рассмотрим экспериментальное распределение биопотенциалов, измеренных у 100 электрических скатов в момент возбуждения. В этой серии опытов максимальное значение напряжения было равно 901 В , минимальное - 789 В.
- весь диапазон измеренных напряжений разбивают на несколько интервалов (в нашем примере на 7) и определяют ширину интервала по формуле (х max - x min) / 7 = (901 - 789)/7 = 16
- определяют средину каждого интервала - < xi >,
- определяют сколько значений измеренных напряжений попадают в каждый интервал - mi,
- определяют вероятность попадания измеряемой величины в каждый интервал – Pi = mi/n.
По этой форме в таблице представлено непрерывное распределение биопотенциалов, измеренных у 100 электрических скатов.
Пользуясь данными таблицы, определяют параметры распределения М(Х), D(X), σ(X) так же, как и при распределении дискретной величины. Среди многих способов графического представления распределения чаще всего применяются два: построение полигона (т.е. многоугольника) и построение гистограммы (столбчатой диаграммы).
В первом случае, экспериментальные точки соединяют последовательно прямыми линиями или линиями плавного перехода. Координатами точек являются: по оси абсцисс - середина интервала < xi >, по оси ординат - значение вероятности Рi или частоты mi. Во втором случае графическое изображение представляется в виде прямоугольников, основание которых соответствует ширине интервала xmin - х mах, а высота значению вероятности Pi или частоты mi . В качестве примеров распределения непрерывной случайной величины рассмотрим три вида теоретических распределений.
Распределение Максвелла
Известно, что в газах молекулы находятся в непрерывном хаотическом движении, причем, скорости молекул могут иметь самое разнообразное значение в определённом интервале. Ввиду неограниченного количества молекул, определить скорость какой-то одной конкретной молекулы не представляется возможным. Однако, можно определить вероятности попадания скоростей молекул в определённый интервал, т.е. определить закон распределения молекул по скоростям или плотность вероятности φ(υ) = Р(α < υ < β). Максвеллом теоретически была определена эта функция плотности вероятности, она выглядит следующим образом
Φ(υ) = (m0/2 πkT)1/2 * e-m0 υ2/2kT
здесь, m0 - масса молекулы, k - постоянная Больцмана, Т - абсолютная температура газа. Графически распределение Максвелла представлено на рис.. Причем распределение будет сдвигаться вправо или влево в зависимости от температуры газа, на рисунке Т1 < Т2
Скорость, соответствующую максимуму Максвелла, называют наивероятнейшей скоростью, она определяется формулой.
υв. = (2kT/m0)1/2
Используя математические методы можно определить среднюю скорость молекул при данной температуре
υcp.= (8kT/πm0)1/2
Распределение Больцмана
Больцман дал распределение концентрации молекул газа в силовом поле, в частности в атмосфере земли. При отсутствии гравитационного поля, ввиду хаотического молекулярного движения, атмосфера Земли не могла бы существовать. Действие только фактора притяжения к Земле, в отсутствие хаотического молекулярного движения, привело бы к тому, что молекулы атмосферы были бы плотно упакованы узким слоем у поверхности Земли. Действие обоих факторов определяет уменьшение плотности воздуха с удалением от поверхности Земли. По расчетам Больцмана концентрация молекул уменьшается по закону:
N = n0-mqh/kT
здесь n - концентрация на высоте h, n0 - у поверхности земли. Поделив обе части уравнения на n0, получим функцию распределения молекул воздуха по плотности φ(h).
n/no = e-mqh/kT; φ(h)e-mqh/kT