Использование вероятностных оценок заключений в продукционных правилах
Ранее каждый факт однозначно определял истинность или ложность продукционного правила. Реально, приходится использовать нечеткую информацию. Обычно выделяют две категории нечеткости: нечёткость представления данных и нечёткость логического вывода. Нечёткость данных проявляется в том, что нельзя точно определить наличие или отсутствие определённого факта, описывающие объекты ПО. Нечёткость логического вывода проявляется в том, что одни и те же факты могут свидетельствовать в пользу нескольких заключений, а степень причинно следственной связи различна. Когда заключение выводится посредством использования нескольких правил, возникает проблема оценки достоверности такого вывода с учётом достоверности промежуточных гипотез, которые принимались как заключение нескольких рассмотренных правил.
Пример: Определить правила, на основании которых можно предсказать погоду на завтра.
Возьмём два состояния: дождливая и сухая. Возьмём ряд признаков : холодно, ветренно, солнечно, туманно. Они будут выполнять роль фактов, которые описывают состояние ПО. Представим задачу в виде схемы:
Может быть выведено первое 1 из альтернативных заключений ПО , каждый из фактов может свидетельствовать и о наличии сухой, и о наличии дождливой погоды. Можно воспользоваться статистическими исследованиями. Составить таблицу, в которой отмечаются дни, соответствующие похолоданию на кануне выпадения дождя. Получим вероятностную оценку зависимости «дождливой погоды» от «холода». P(D/x)
Для каждого из фактов можно указать вероятность как одного, так и второго заключения. Встаёт задача определения совокупного влияния множества наблюдаемых фактов, и с точки зрения теории вероятности необходимо определить условную вероятность заключающуюся в зависимости от сложного события, которое представляет собой объединение «ветренно», «солнечно», «холодно». P(D/B∩C∩X)
Необходимо знать, будет ли эта вероятность > или < вероятности альтернативного события.
P(C / C…)
Для решения задачи можно воспользоваться методом решения Байеса (исследуя формулы полной и условной вероятности событий ).
Вероятность дождя от совокупности фактов, влияющих на погоду, можно представить:
(1)
Каждый из фактов свидетельствует в пользу того или иного заключения через условную вероятность событий. Наибольшие трудности возникают при определении условной вероятности сложного события. Если в качестве х рассматривать влияние нескольких факторов, то
(2)
Может быть определено как произведение условных вероятностей. Воспользоваться этой формулой можно, только если элементарные события Z и Y, из которых складывается событие х, не коррелированны друг с другом, т. е. Отсутствует взаимная связь. Если между признаками существует функциональная зависимость, то условная вероятность сложного события х:
P(x/D)=P(Z/D)=P(Y/D) (3)
Аналогичная проблема выводится в случае определения вероятности заключения, если оно выводится с помощью нескольких правил.
Необходимо определить функцию учета вероятности гипотезы, выведенной на основании нескольких правил. Это будет соответствовать случаю, когда условная вероятность представляет собой вероятность сложного события, представляющая собой объединение элементарных событий.
P(x/D)=P((Z объединить Y)/D)=P(Z /D)+ P(Y/ D)- P(Z /D) *P(Y/ D) (4)
Формулу можно применить, если события Z и Y не коррелированы друг с другом. Если же имеется строгая функциональная зависимость, то возвращение к формуле (3).
Достаточно трудно определить степень взаимной связи двух или нескольких событий. Существуют методы, косвенно учитывающие взаимные связи. Один из таких методов реализован ЭС , предназначенный для анализа результатов геологических исследований с целью определения возможности разработки залежей полезных ископаемых. Заключения, формируемые такой системой, помимо вывода о том, что полезные ископаемые присутствуют в геологических пробах, необходимо определить, насколько целесообразна их разработка, что можно сделать указанием вероятностной оценки, с помощью которой можно было бы сравнить несколько альтернативных мест разработки, т. к. важно не только копать там, где возможны залежи, но и не копать там, где их нет.
Для подтверждения гипотезы обойдем вокруг горы и попытаемся найти самородок. Известно, что вероятность обнаружить самородок, если в горе есть золото. P(X/H)=0.3
Существует вероятность, что самородок попал сюда с другой горы. Если в горе нет золота –
Обойдя гору придет к заключению, есть или нет самородка.
- признак правдоподобия
В результате того, что мы подтвердили факт обнаружения самородка, мы увеличили вероятность от 0.5 до 0.75.
Можно провести расчет. Получили уточненное значение, которое соответствует одному из четких значений фактов. Если “да”- вероятность 0.75.
Если “нет” - вероятность 0.44.
Используем шкалу:
Если на этой шкале выбрать промежуточное значение, то можно уточнить вероятность гипотезы при помощи формулы интерполирования. Вероятность наличия или отсутствия факта:
Z-признак, указанный в виде значения на выбранной шкале.
S- предел шкалы.
Впоследствии, определенная нами условная вероятность :
Если мы хотим использовать еще какой-либо признак, необходимо оценку вероятности взять за исходную, а не 0.5, и уточнять ее с использованием следующего признака. Поочередно рассматривая каждый из фактов, необходимо последовательно уточнять вероятность выдвинутой гипотезы.
· вероятность гипотезы P(H)
· - характеризует возможность осуществления или неосуществления некоторого события
· вероятность осуществления факта P(E)
Лекция №6
Пример: Более простой способ определения нечеткого заключения.
Объект, атрибут, значение (О-А-З) + фактор достоверности(CF) , который используется для утверждения или отрицания некоторого заключения. Предметная область структурирована или (стратифицирована)!!!!!!!!!!с использованием иерархических отношений.
Результаты анализов.
Инф.- инфекция. Для определения вероятности диагноза следует определить степень достоверности. При описании продукционных правил в каждом условии устанавливается собственный фактор уверенности правила идентификации вируса, например содержит объект называемый организация , атрибут, окраска ГП. СР 0.7
Значение фактора уверенности вводится экспертом при составлении БЗ. Однако , если такой факт имеется в рабочей памяти, то значение фактора уверенности остается заданным, в противном случае делается запрос к пользователю БЗ , который может указать свое отношение к этому факту используя шкалу от –1 до 1. Окончательное значение фактора уверенности вычисляется как произведение исходного значения на значение введенное пользователем. CF*Z≥0.2
-
|
Правило где содержится только одно условие , вычисленное значение фактора уверенности принимается в качестве вероятностной оценки всего заключения, если условная часть содержит несколько элементов, то в качестве регулятора принимается минимальный фактор уверенности. Заключительная часть содержит помимо заключения, которое будет являться фактом для следующего правила, содержит два параметра. Первая переменная наследует минимальный фактор уверенности в условной части правила, последний параметр показывает достоверность заключения в том случае если условная часть не содержит нечеткости , т. е. Факторы все равны меньше 1.Окончательная достоверность заключения определяется произведением Т(наследуемого параметра) на CF (фактор уверенности заключительной части). Если в рабочей памяти отсутствует заключительная часть, то такой объект заносится в рабочую память вместе с вычисленным фактором уверенности в рабочей памяти уже существовал объект с таким именем, то происходит корректировка значений фактора уверенности объекта содержащегося в рабочей памяти.
Из двух сравниваемых факторов уверенности выбирается максимальный. Max(CFi ,CFi . . .)
В результате прямого логического вывода, система выводит все возможные диагнозы, соответствующие заданному набору фактов, которые определяются в результате анализа. Каждому предполагаемому диагнозу ставится рассчитанный фактор уверенности, следовательно можно ранжировать список возможных заключений в соответствии с фактором уверенности. Однако окончательное решение принимает врач ставящий диагноз пациенту. Такая методика не имеет строго подтверждения, но результаты позволяют судить о том , что предполагаемые заключения адекватны заключениям специалистов.
CF3=max(CF3,CF2) → CF3=min(CFn1,CFn2)