Зависимые события. Теорема умножения вероятностей для зависимых событий
Случайные события А и В называются зависимыми, если появление одного из них, например, А изменяет вероятность появления другого события – В. Поэтому для зависимых событий используются два значения вероятности: безусловнаяи условнаявероятности.
Если А и В зависимыесобытия, то вероятность наступления события В первым (т.е. до события А) называется безусловной вероятностью этого события и обозначается Р(В).Вероятность наступления события В при условии, что событие А уже произошло, называется условной вероятностьюсобытия В и обозначается Р(В/А) или РА (В).
Аналогичный смысл имеют безусловная – Р(А) и условная – Р(А/В) вероятности для события А.
Теорема умножения вероятностейдля двух зависимых событий: вероятность одновременного наступления двух зависимых событий А и В равна произведению безусловной вероятности первого события на условную вероятность второго:
Р(А и В) = Р(А) ∙Р(В/А) , (8)
если первым наступает событие А, или
Р(А и В) = Р(В) ∙Р(А/В), (9)
если первым наступает событие В.
Пример 1.В урне 3 черных шара и 7 белых. Найдите вероятность того, что из этой урныодин за другим(причем первый шар не возвращают в урну) будут вынуты 2 белых шара.
Решение: вероятность достать первый белый шар (событие А) равна 7/10. После того как он вынут, в урне остается 9 шаров, из них 6 белых. Тогда вероятность появления второго белого шара (событие В) равна Р(В/А) = 6/9, а вероятность достать подряд два белых шара равна
Р(А и В) = Р(А)∙Р(В/А) = = 0,47 = 47%.
Приведенная теорема умножения вероятностей для зависимых событий допускает обобщение на любое количество событий. В частности, для трех событий, связанных друг с другом:
Р(А и В и С) = Р(А) ∙ Р(В/А) ∙ Р(С/АВ). (10)
Пример 2. В двух детских садах, каждый из которых посещает по 100 детей, произошла вспышка инфекционного заболевания. Доли заболевших составляют соответственно 1/5 и 1/4, причем в первом учреждении 70 %, а во втором – 60 % заболевших – дети младше 3-х лет. Случайным образом выбирают одного ребенка. Определите вероятность того, что:
1) выбранный ребенок относится к первому детскому саду (событие А) и болен (событие В).
2) выбран ребенок из второго детского сада (событие С), болен (событие D) и старше 3-х лет (событие Е).
Решение.1) искомая вероятность –
Р(А и В) = Р(А) ∙ Р(В/А) = = 0,1 = 10%.
2) искомая вероятность:
Р(С и D и Е) = Р(С) ∙ Р(D/C) ∙ Р(Е/CD) = = 5%.
Формула Байеса
Если вероятность совместного появления зависимых событий А и В не зависит от того, в каком порядке они происходят, то Р(А и В) = Р(А) ∙Р(В/А) = Р(В) × Р(А/В). В этом случае условнуювероятность одного из событий можно найти, зная вероятности обоих событий и условную вероятность второго:
Р(В/А) = (11)
Обобщением данной формулы на случай многих событий является формула Байеса.
Пусть «n» несовместных случайных событий Н1, Н2, …, Нn, образуют полнуюгруппу событий. Вероятности этих событий – Р(Н1), Р(Н2), …, Р(Нn) известны и так как они образуют полную группу , то = 1.
Некоторое случайное событие А связано с событиями Н1, Н2, …, Нn, причем известны условные вероятности появления события А с каждым из событий Нi , т.е. известны Р(А/Н1), Р(А/Н2), …, Р(А/Нn). При этом сумма условных вероятностей Р(А/Нi) может быть не равна единице т.е. ≠ 1.
Тогда условная вероятность появления события Нi при реализации события А (т.е. при условии, что событие А произошло) определяется формулойБайеса:
= (12)
Причем для этих условных вероятностей .
Формула Байеса нашла широкое применение не только в математике, но и в медицине. Например, она используется для вычисления вероятностей тех или иных заболеваний. Так, если Н1,…, Нn – предполагаемые диагнозы для данного пациента, А – некоторый признак, имеющий отношение к ним (симптом, определенный показатель анализа крови, мочи, деталь рентгенограммы и т.д.), а условные вероятности Р(А/Нi) проявления этого признака при каждом диагнозе Нi (i = 1,2,3,…n) заранее известны, то формула Байеса (12) позволяет вычислить условные вероятности заболеваний (диагнозов) Р(Нi/А) после того как установлено, что характерный признак А присутствует у пациента.
Пример1. При первичном осмотре больного предполагаются 3 диагноза Н1, Н2, Н3. Их вероятности, по мнению врача, распределяются так: Р(Н1) = 0,5; Р(Н2) = 0,17; Р(Н3) = 0,33. Следовательно, предварительно наиболее вероятным кажется первый диагноз. Для его уточнения назначается, например, анализ крови, в котором ожидается увеличение СОЭ (событие А). Заранее известно (на основании результатов исследований), что вероятности увеличения СОЭ при предполагаемых заболеваниях равны:
Р(А/Н1) = 0,1; Р(А/Н2) = 0,2; Р(А/Н3) = 0,9.
В полученном анализе зафиксировано увеличение СОЭ (событие А произошло). Тогда расчет по формуле Байеса (12) дает значения вероятностей предполагаемых заболеваний при увеличенном значении СОЭ: Р(Н1/А) = 0,13; Р(Н2/А) = 0,09;
Р(Н3/А) = 0,78. Эти цифры показывают, что с учетом лабораторных данных наиболее реален не первый, а третий диагноз, вероятность которого теперь оказалась достаточно большой.
Приведенный пример – простейшая иллюстрация того, как с помощью формулы Байеса можно формализовать логику врача при постановке диагноза и благодаря этому создать методы компьютерной диагностики.
Пример 2. Определите вероятность, оценивающую степень риска перинатальной* смертности ребенка у женщин с анатомически узким тазом.
Решение: пусть событие Н1 – благополучные роды. По данным клинических отчетов, Р(Н1) = 0,975 = 97,5 %, тогда, если Н2 – факт перинатальной смертности, то Р(Н2) = 1 – 0,975 = 0,025 = 2,5 %.
Обозначим А – факт наличия узкого таза у роженицы. Из проведенных исследований известны: а) Р(А/Н1) – вероятность узкого таза при благоприятных родах, Р(А/Н1) = 0,029, б) Р(А/Н2) – вероятность узкого таза при перинатальной смертности,
Р(А/Н2) = 0,051. Тогда искомая вероятность перинатальной смертности при узком тазе у роженицы рассчитывается по формуле Байса (12) и равна:
Таким образом, риск перинатальной смертности при анатомически узком тазе значительно выше (почти вдвое) среднего риска (4,4 % против 2,5 %).
Подобные расчеты, обычно выполняемые с помощью компьютера, лежат в основе методов формирования групп пациентов повышенного риска, связанного с наличием того или иного отягощающего фактора.
Формула Байеса очень полезна для оценки многих других медико-биологических ситуаций, что станет очевидным при решении приведенных в пособии задач.