Теорема гипотез и Байесовские подходы
Теорема гипотез дает возможность пересматривать принятое первоначально решение о вероятностях появления интересующих нас событий в зависимости от поступившей дополнительно информации.Байесовские методы позволяют включать ранее известные знания, убеждения и информацию, помимо тех, что содержатся в наблюдаемых данных, в процесс вывода. Сюда могут включаться данные из предыдущих исследований, известные характеристики используемой модели, и другие объективные или субъективные источники данных.
Формула Байеса – одна из основных теорем элементарной теории вероятностей, которая позволяет определить вероятностьтого, что произошло какое-либо событие (гипотеза) при наличии лишь косвенных тому подтверждений (данных), которые могут быть неточны.
Вероятности, характеризующие суждение человека о состояниях внешнего мира и будущих событиях (иначе говоря, первоначальные вероятности гипотез) до получения дополнительной информации, называются априорными.
Вероятности, пересмотренные после получения дополнительной информации, называются апостериорными.
Априорность и апостериорность относятся к конкретной вероятности и являются понятиями относительными. Апостериорные вероятности по отношению к предшествующему наблюдению могут выступать в роли априорных по отношению к последующему наблюдению.
Формула Байеса записывается следующим образом:
где P(A) — априорная вероятность гипотезы А, — вероятность гипотезы A при наступлении события B(апостериорная вероятность), — вероятность наступления события B при истинности гипотезы A,P(B) — вероятность наступления события B.
Отношение правдоподобия – это отношение двух вероятностей получения определенного результата испытания. Оно количественно отражает влияние результата испытания на априорную вероятность:
Апостериорная вероятность = априорная вероятность x отношение правдоподобия
Современные психологи считают оптимальной моделью формирования врачом диагноза именно формулы Байеса (основную и ее модификации). Предварительный диагноз является гипотезой, сформулированной на основе априорной вероятности. Применение дополнительных методов обследования, дающих возможность получить дополнительную информацию, позволяет установить окончательный клинический диагноз с позиции апостериорной вероятности.
Многочисленные исследования, посвященные изучению процесса формирования диагноза, позволяют утверждать, что врачи могут не производить коррекцию первоначальной оценки вероятности, как правило, недооценивая последующую информацию.
Последнее качество, свойственное большинству людей, принято называть познавательным консерватизмом.
Необходимо всегда помнить, что на основе неточной или ошибочной информации нельзя получить точное и правильное решение. Именно поэтому математические методы применяются лишь в тех областях науки и практики, в которых накоплен достаточный опыт и имеется необходимый объем объективной информации.
Пример решения задачи с использованием теории вероятности
Рассмотрим простой и наглядный пример для схемы случаев. Именно для этой схемы можно точно рассчитать вероятность события, чем и объясняется столь частое к ней обращение.
Пусть имеются 3 внешне одинаковые урны, содержащие черные и белые шары. В первой урне находятся 2 белых и 1 черный шар, во второй — 3 белых и 1 черный, в третьей — 2 белых и 2 черных. Рассмотрим событие А, заключающееся в выборе белого шара из наугад выбранной урны.
В этом примере гипотезы H1, Н2, и Н3 заключаются в выборе первой, второй и третьей урны, соответственно. Поскольку все урны одинаковы, гипотезы равновозможны, отсюда вероятности выбора любой из урн одинаковы и равны:
Условные вероятности события А при каждой из гипотез определяются отношением числа белых шаров к общему числу шаров в каждой урне
Вероятность события А при наугад выбранной урне определится по формуле полной вероятности:
Схема испытаний Бернулли
Со схемой испытаний Бернулли связано установление важных закономерностей теории вероятностей как математической науки, относящихся к сумме независимых случайных величин и представляющих закон больших чисел. Физическим содержанием закона больших чисел является устойчивость некоторых средних в массовых случайных явлениях. В узком смысле под законом больших чисел в теории вероятностей понимается ряд математических теорем, устанавливающих факт приближения средних характеристик большого числа испытаний к некоторым определенным постоянным. Важные теоремы, составляющие закон больших чисел, впервые были выведены для схемы испытаний Бернулли.
Теорема Чебышева. Среднее арифметическое наблюдаемых значений случайной величины при достаточно большом числе испытаний приближается к ее математическому ожиданию.
Теорема Бернулли. Частота случайного события при достаточно большом числе независимых испытаний в неизменных условиях приближается к вероятности его появления в отдельном испытании.
Теорема Пуассона. Частота случайного события при достаточно большом числе независимых испытаний приближается к среднему арифметическому вероятностей его проявления в отдельных испытаниях.
Центральная предельная теорема. Закон распределения суммы достаточно большого числа слагаемых, каждое из которых в отдельности сравнительно мало влияет на сумму, приближается к нормальному закону распределения.
Определение понятий «испытание» и «схема испытаний Бернулли»
При рассмотрении схемы испытаний Бернулли в слово «испытание» вкладывается богатый и разнообразный смысл.
Под испытанием будем понимать осуществление определенных условий, при наличии которых может наступить интересующее нас событие.
Санитарно-демографические характеристики конкретной территории формируются в результате «осуществления определенных условий», которые приводят к конкретным уровням заболеваемости, смертности, детской смертности и других показателей.
Эффективность воздействия изучаемого препарата может быть определена в результате «осуществления определенных условий», которые обеспечиваются исследователем при выборе соответствующего контингента, обеспечении требующихся внешних условий и планировании тактики проведения эксперимента.
То обстоятельство, что в первом случае мы фиксируем сложившуюся без нашего активного участия картину, а во втором являемся ее создателями, для нас не играет сейчас никакой роли. Для нас сейчас важно то, что как в первом, так и во втором случае мы имеем дело с «осуществлением определенных условий», при наличии которых может «наступить интересующее нас событие». При этом в первом случае мы должны проследить судьбу каждого отдельного человека (заболел или не заболел, умер или остался жить и т.д.) из состава всего контингента. Во втором случае — судьбу каждого индивидуума из состава отобранного предварительно контингента. Но в обоих случаях мы имеем дело с испытанием.
При практическом применении теории вероятностей часто приходится встречаться с задачами, в которых одно и то же испытание или аналогичные испытания повторяются неоднократно. В результате каждого испытания может появиться или не появиться интересующее нас событие. Но нас интересует не появление события в каждом отдельном испытании, а общее число появления событий в серии испытаний. Так, при анализе заболеваемости нас интересует не судьба отдельного человека, а общее число заболеваний на данной территории, при исследовании нового препарата — эффективность его воздействия не на каждого отдельного индивидуума, а на отобранный контингент в целом.
Теория вероятностей изучает общие закономерности в массовых случайных явлениях, в то время как врачу-клиницисту представляются одни частные случаи. Конечно, общие заключения не следует безоговорочно применять в каждом частном случае, но начиная рассмотрение каждого частного случая, нужно иметь в виду общие закономерности.
Схема испытаний Бернулли— схема независимых испытаний, проводимых в неизменных условиях при наличии двух возможных исходов (успеха или неудачи).
Рассмотрим каждую характеристику схемы отдельно.
Несколько испытаний называются независимыми, если вероятность того или иного исхода каждого из испытаний не зависит от предыстории, т.е. от того, какие исходы имели предшествующие испытания. Это значит, что вероятность того или иного исхода не зависит от числа ранее появившихся интересующих нас событий. При зарегистрированной частоте рождений мальчиков, равной 0.52, будущему отцу, ожидающему наследника, вовсе нет причины горевать, узнав, что три четверти новорожденных, появившихся на свет в течение недели в том родильном доме, куда он отвез свою жену, — мальчики. Вероятность того, что у него появится наследник, не стала меньше от того, что до появления его ребенка в данном родильном доме в течение данного времени у других родителей появилось намного больше мальчиков, чем девочек. Вероятность, на которую рассчитывает этот отец, остается все той же и при оценке ее по достаточно большому числу наблюдений ошибки не будет.
Неизменность условий позволяет считать, что вероятность появления интересующего нас события во всех испытаниях остается одной и той же. Рассматривая и анализируя санитарно-демографические характеристики, мы пренебрегаем отклонениями от усредненных условий и предполагаем, что вероятность заболеть или умереть остается одной и той же для любого индивидуума, входящего в состав контингента. Планируя проведение эксперимента с целью выявления эффективности действия препарата, мы заботимся об однородном подборе контингента, иначе эксперимент будет поставлен некорректно.
Наличие только двух возможных исходов: успеха и неудачи — понятие очевидное. При анализе, например, заболеваемости это условие означает, что любой человек может только заболеть или не заболеть. Здесь судьба каждого отдельного человека на данном отрезке времени представляет собой отдельное испытание. При проведении эксперимента для оценки эффективности препарата мы фиксируем успех или неудачу, наблюдая за состоянием отдельного индивидуума, судьба которого и составляет отдельное испытание. Обследование новорожденных с целью определения их состава предполагает также два возможных исхода: рождение мальчика или девочки.