Формирование правил на основе дерева решений
На примере задачи об идентификации типа растения рассмотрим, как «дерево решений» можно представить в виде правил.
Первым этапом формирования правил является перевод «дерева решений» из вопросов-ответов в утверждения-факты. Графически для рис. 3.2 это будет соответствовать представлению в виде рис. 3.5.
Рис. 3.5. Формирование правил
Аналогичные преобразования могут быть выполнены для всех «поддеревьев» «дерева решений».
Общим для них является то, что все утверждения представляются предложениями которые состоят из <атрибута>, <предиката>,<значения>.
Например:
<тип растения> <является> <дерево>
<стебель> <является > <зеленый>
В данной трактовке:
Атрибут - это ключевое слово или фраза, описывающая некоторое качество, о котором мы пытаемся найти информацию.
Значение - это описание, назначенное атрибуту.
Предикат - это элемент, указывающий на отношения между атрибутом и его значением.
Более строго это понятие будет определено в следующих разделах. На этом этапе мы предполагаем, что между атрибутом и его значением существует только одно отношение – являться (принадлежать, быть), которое для кратности будем обозначать IS.
Следует отметить, что в простейших ЭС, в том числе и в Микроэксперт для PC, единственно используемым также является предикат IS.
Тогда все множество фактов для «дерева решений» можно представить набором предложений (таблица 3.1).
Таблица 3.1
Факты
Атрибут | Предикат | Значение |
Тип растения | Is | Травянистые Дерево Кустарниковые Лиановые |
Стебель | Is | Зеленый Древесный |
Положение стебля | Is | Прямое Стелется |
Основной стебель | Is | Один Несколько |
Непротиворечивое подмножество этих фактов будет составлять БД экспертной системы.
Решение любой задачи на этой БД можно получить с помощью правил, из которых формируется БЗ. Набор правил на основе «дерева решений» формируется исходя из:
- каждая ветвь дерева решений от ее начала до конца образует правило;
- предложения в дереве решений расположен до стрелки образуют условную часть правила, а после стрелки - заключение правила;
- ветвь в которой нет заключения не может быть представлена в виде правила;
- каждое предложение условной части правила представляет собой конъюнктивный член, т. е. предложения соединяются логической коннъюнкцией («и»).
Пример:
ЕСЛИ стебель IS древесный
И положение IS прямое
И основной стебель IS один
ТО тип растения IS дерево
В некоторых языках программирования и оболочках экспертных систем используется более короткая запись правил:
- исключается предлог «то»;
- вместо логического «и» используется запятая;
- предикат записывается в скобочном виде.
В этом случае приведенное выше правило можно записать в виде:
IS (type_of_plant, tree) if IS (stream, woody),
IS (position, upright),
IS (main_treak, one).