Последовательное распространение вероятностей
Однако реально, распространение вероятностей происходит поэтапно с суммированием отдельных свидетельств и их влияния на условную вероятность по мере поступления отдельных Ei. Это можно сделать, используя априорные и апостериорные вероятности, следующим образом:
Задаём - априорную вероятность событий .
Для полученных свидетельств записываем .
С учётом теоремы Байеса подсчитываем в зависимости от исхода , то есть вычисляем апостериорную вероятность события .
Теперь можно не обращать внимания на все наступившие и переобозначить текущую апостериорную вероятность события , как новую априорную вероятность . Итак, пусть равна в зависимости от значения .
Затем выберем новое свидетельство для рассмотрения и перейдём к п.2.
Проиллюстрируем эту последовательность на приведенном выше примере в предположении, что сначала поступило свидетельство . Тогда:
Полученные вероятности можно принять за новые апостериорные вероятности гипотез , то есть:
И если теперь дополнительно поступит свидетельство , то новые апостериорные вероятности гипотез могут быть вычислены только на основе вновь поступившего свидетельства:
Из приведенного примера видно, что итерационная процедура последовательного распределения вероятностей по мере поступления свидетельств позволяет получить результаты аналогичные непосредственному применению правила Байеса для случая одновременного двух поступивших свидетельств.
Байесовские сети доверия.
Байесовская сеть (или Байесовская сеть доверия) — это вероятностная модель, представляющая собой множество переменных и их вероятностных зависимостей. Например, байесовская сеть может быть использована для вычисления вероятности того, чем болен пациент по наличию или отсутствию ряда симптомов, основываясь на данных о зависимости между симптомами и болезнями.
Формально, байесовская сеть — это направленный ациклический граф, вершины которого представляют переменные, а ребра кодируют условные зависимости между переменными. Вершины могут представлять переменные любых типов, быть взвешенными параметрами, скрытыми переменными или гипотезами.
Если ребро выходит из вершины A в вершину B, то A называют предком B, а B называют сыном A. Множество вершин-предков вершины Xi обозначим как parents(Xi). Совместное распределение значений в вершинах можно удобно расписать как результат локальных распределений в каждом узле и его предках:
Если у вершины Xi нет предков, то его локальное распределение вероятностей называют безусловным, иначе условным. Если значение в узле получено в результате опыта, то вершину называют свидетелем.
Граф кодирует зависимости между переменными. Условная независимость представлена графическим свойством d-разделенности.
Два узла направленного графа x и y называются d-разделенными, если для всякого пути из x в y (здесь не учитывается направление ребер) существует такой промежуточный узел z (не совпадающий ни с x, ни с y), что либо связь в пути в этом узле последовательная или расходящаяся, и узел z получил означивание, либо связь сходящаяся, и ни узел z, ни какой-либо из его потомков означивания не получил. В противном случае узлы называются d-связанными.Свидетельства — утверждения вида «событие в узле x произошло». Например: «Компьютер не загружается».
Процесс рассуждения в байесовских сетях доверия. Пример построения простейшей байесовской сети доверия.
Вероятности события в ЭС распространяются в БЗ на основе правила Байесса.
Рассматриваем небольшую яблочную плантацию «яблочного Джека». Однажды Джек обнаружил, что его прекрасное яблочное дерево лишилось листвы. Теперь он хочет выяснить, почему это случилось. Он знает, что листва часто опадает, если:
дерево засыхает в результате недостатка влаги; или дерево болеет.
Данная ситуация может быть смоделирована байесовской сетью доверия, содержащей 3 вершины: «Болеет», «Засохло» и «Облетело».
Рис.1. Пример байесовской сети доверия с тремя событиями.
В данном простейшем случае рассмотрим ситуацию, при которой каждая вершина может принимать всего лишь два возможных состояний и, как следствие находится в одном из них, а именно:
Вершина (событие) БСД Состояние 1 Состояние 2
“Болеет” «болеет» «нет»
“Засохло” «засохло» «нет»
“Облетело” «да» «нет»
Вершина “Болеет” говорит о том, что дерево заболело, будучи в состоянии «болеет», в противном случае она находится в состоянии «нет». Аналогично для других двух вершин. Рассматриваемая байесовская сеть доверия, моделирует тот факт, что имеется причинно-следственная зависимость от события “Болеет” к событию “Облетело” и от события “Засохло” к событию “Облетело”. Это отображено стрелками на байесовской сети доверия.Когда есть причинно-следственная зависимость от вершины А к другой вершине B, то мы ожидаем, что когда A находится в некотором определённом состоянии, это оказывает влияние на состояние B. Следует быть внимательным, когда моделируется зависимость в байесовских сетях доверия. Иногда совсем не очевидно, какое направление должна иметь стрелка.
Например, в рассматриваемом примере, мы говорим, что имеется зависимость от “Болеет” к “Облетело”, так как когда дерево болеет, это может вызывать опадание его листвы. Опадание листвы является следствием болезни, а не болезнь – следствием опадания листвы.На приведенном выше рисунке дано графическое представление байесовской сети доверия. Однако, это только качественное представление байесовской сети доверия. Перед тем, как назвать это полностью байесовской сетью доверия необходимо определить количественное представление, то есть множество таблиц условных вероятностей:
Априорная вероятность p(“Болеет”)
Априорная вероятность p(“Засохло”)
Болеет = «болеет» Болеет = «нет»
Засохло = «засохло» Засохло = «нет»
0,1 0,9
0,1 0,9
Таблица условных вероятностей p(“Облетело” | ”Болеет”, ”Засохло”)
Засохло = «засохло» Засохло = «нет»
Болеет = «болеет» Болеет = «нет» Болеет = «болеет» Болеет = «нет»
Облетело = «да» 0,95 0,85 0,90 0,02
Облетело = «нет» 0,05 0,15 0,10 0,98
Приведенные таблицы иллюстрируют ТУВ для трёх вершин байесовской сети доверия. Заметим, что все три таблицы показывают вероятность пребывания некоторой вершины в определённом состоянии, обусловленным состоянием её родительских вершин. Но так как вершины Болеет и Засохло не имеют родительских вершин, то их вероятности являются маргинальными, т.е. не зависят (не обусловлены) ни от чего.
На данном примере мы рассмотрели, что и как описывается очень простой байесовской сетью доверия. Современные программные средства (такие как MSBN, Hugin и др.) обеспечивают инструментарий для построения таких сетей, а также возможность использования байесовских сетей доверия для введения новых свидетельств и получения решения (вывода) за счёт пересчёта новых вероятностей во всех вершинах, соответствующих вновь введенным свидетельствам.
В нашем примере пусть известно, что дерево сбросило листву. Это свидетельство вводится выбором состояния «да» в вершине “Облетело”. После этого можно узнать вероятности того, что дерево засохло. Для приведенных выше исходных данных, результаты вывода путем распространения вероятностей по БСД будут:
p( “Болеет” = «болеет» | “Облетело” = «да») = 0,47; p( “Засохло” = «засохло» | “Облетело” = «да») = 0,49.