Формальные основы интеллектуальных систем. Основные принципы работы интеллектуальных систем
Основой для создания ЭС послужил процесс моделирования на ЭВМ процесса принятия решений. Формализуя предложения Ньюэлла, можно определить интеллектуальную систему следующим образом [4-6]:
ИС-<РП,БЗ,И>, где РП - рабочая память системы, содержащая текущие данные;
БЗ - база знаний, содержащая множество данных, знаний;
И - интерпретатор («решатель»), реализующий процесс вывода, который в цикле выполняет действия по получению решения. Формально интерпретатор можно представить выражением
И**<В,С,К,ВП>, где В " Процесс выбора из БЗ и РП подмножества активных знаний, которые будут использованы в текущем цикле решателя. В усложненных системах механизм выбора может использовать иерархию правил, метаправила и т.п.;
С - процесс сопоставления, определяющий множество означиваний, то есть множество пар «правило - данные»;
К - процесс разрешения конфликтов, определяющий, какое из означиваний будет выполняться. Механизм разрешения конфликтов может быть явным или неявным. Чаще всего используется набор метаправил;
ВП - процесс, осуществляющий выполнение выбранного означенного правила. Результатом выполнения является модификация РП иди операция ввода-вывода.
Причины успешного практического использования экспертных систем определяются выполнением следующих основных требований:
1. Мощность ЭС обусловлена мощностью БЭ и возможностью ее пополнения, в также используемыми ею методами.
2. Знания, позволяющие эксперту (иди ЭС) получить качественные и эффективные решения задач, являются в основном эвристическими, экспериментальными, неопределенными, правдоподобными. Причина этого заключается в том, что задачи являются слабо формализованными или неформализованными. Обычно знания эксперта являются индивидуальными, то есть свойственны конкретному человеку.
3. Учитывая неформализованность решаемых задач и эвристический, личностный характер используемых знаний, пользователь или эксперт должен иметь возможность непосредственного взаимодействия с ЭС в виде диалога.
Принципы работы ЭС вытекают из требований, сформулированных выше. В соответствии с первыми двумя требованиями ЭС включает 2 компонента: решатель (интерпретатор) и динамически изменяемая БЗ. Выбор в качестве основы для реализации решателя предполагает наличие РП.
Третье требование предполагает следующее:
- способность вести диалог о решаемой задаче на языке, удобном и понятном пользователю (эксперту);
- возможность получать новые знания;
- построение объяснений и комментариев к полученному решению.
Это требование говорит о необходимости еще 2 компонентов: диалог и приобретшие знаний.
Общая схема функционирования ЭС представлена на рис. 1 [4,9]. Краткое описание компонент экспертной системы приведено в табл» 1.
РП ЭС предназначена для хранения знаний. Знания в РП могут быть однородны или разделяться на уровни иерархии проблемной области. Выделение уровне!* усложняет структуру ЭС, но делает получение решения более эффективным. Если РП состоит из сложных элементов, то связь между отдельными объектами указывается явно, например, заданием семантических отношений. При этом объект может иметь свою внутреннюю структуру.
Сточки зрения представления знаний подход, использующий управляемые образцами модули, можно охарактеризовать следующими особенностями:
-разделение знаний на постоянно хранимые в БЗ и временные, хранимые вРП;
- структурная независимость модулей, облегчающая модификацию и совершенствование системы;
- отделение схемы управления от модулей, носящих знания о проблемной области, что позволяет применять различные схемы управления.
Ввод данных Заключения, советы, объяснения Рис. 1. Общая схема работы ЭС |
Таблица 1
Основные компоненты экспертной системы
|
2.4.Архитектура интеллектуальных систем. Основные компоненты: интерпретатор, рабочая память, база знаний, компонент приобретения знаний, объяснительный компонент, диалоговый компонент.
Архитектура интеллектуальных систем.
Ввод данных Заключения, советы, объяснения Рис. 1. Общая схема работы ЭС |
Основные компоненты ЭС | Назначение |
База данных | Хранение исходных и промежуточных данных решаемой задачи |
База знаний | Хранение знаний о проблемной области, накопленном опыте, механизмах получения решений |
Интерпретатор | Получение решения задачи согласно требованиям пользователя и содержанию БЗ |
Приобретение знаний | Получение новых знаний от эксперта н передача их для использования в БЗ |
Объяснение | Хранение информации о том, как получено решение и [ какие знания использовала система |
Диалог | Проведение диалога с пользователем и экспертом |
Рабочая память | Хранение знаний о решаемой в данный момент задаче. 1 промежуточных результатов |
Данная архитектура работает только для статических систем. Для динамических систем добавляют еще 2 компонента:
1. система моделирования внешнего мира. Работает с диалоговым компонентом, с рабочей памятью, с решателем и с базой знаний. Компоненты, которые общаются с системой моделирования, могут изменять алгоритмы работы и хранимую информацию.
2. датчики (система взаимодействия, общения с внешним миром). Работают только с системой моделирования внешнего мира.
Архитектура ЭС зависит от проблемной области, возможно изменение компонентов и их функций.
2.5.Модели представления знаний: логическая, фреймовая, семантическая. Преимущества и недостатки моделей.
ДАННЫЕ в информатике - информация, представленная в формализованном виде, что обеспечивает возможность ее хранения, обработки и передачи.
ЗНАНИЕ - форма существования и систематизации результатов познавательной деятельности человека. Выделяют различные виды знания: обыденное («здравый смысл»), личностное, неявное и др. Научному знанию присущи логическая обоснованность, доказательность, воспроизводимость познавательных результатов. Знание объективизируется знаковыми средствами языка.
Отличия процедурных знаний от декларативных:
Различия между ними можно выразить как разницу между «знать, что» и «знать, как».
Процедурные знания. Знание о том, как можно ислолноватъ предметные сущности. При модификации необходимо учитывать, каким образом используется данное утверждение.
Декларативные знания. Знание рассматривается как множество независимых или слабо зааисиммх фактов, что позволяет осуществлять модификацию знаний и обучение простым добавлением или устранением утверждений. Универсальный набор процедур, обрабатывающий факты любого типа, и множество частных фактов, описывающих проблемную область.
1 Логическая модель представления знаний
В основе логической модели лежит понятие формальной теории, задаваемой выражением:
<В, F, A, R>,
где В - счетное множество базовых символов теории,
F - подмножество выражений теории, называемых формулами теории (обычно существует эффективная процедура, позволяющая строить из В синтаксически правильные выражения (формулы)), А - выделенное множество формул, называемых аксиомами теории, то
есть множество априорно истинных формул, R - конечное множество отношений между формулами, называемыми правилами вывода.
Формальная теория является разрешимой, если существует единая эффективная процедура, позволяющая узнать для любой данной формулы, существует ли для нее вывод. Для того, чтобы придать формуле содержание, ее интерпретируют как утверждение, касающееся рассматриваемой предметной области.
Основным достоинством использования логической модели представления знаний является наличие единообразной формальной процедуры построения решений. Однако высокая степень единообразия влечет за собой и основной недостаток этого подхода - сложность использования при доказательстве, отражающем специфику проблемной среды. Это становится особенно важным при построении ЭС, вычислительная мощность которых в основном определяется знаниями, характеризующими специфику проблемной среды. К другим недостаткам формальных систем следует отнести их монотонность, отсутствие средств для структурирования используемых элементов и недопустимость противоречий.
2 Семантическая модель представления знаний
В основе семантических моделей лежит понятие сети, образованной помеченными вершинами и дугами. Вершины сети представляют некоторые сущности (объекты, события, процессы, явления), а дуги - отношения между сущностями, которые их связывают.
Наложив ограничения на описания вершин и дуг, можно получить сети различного вида. Если вершины не имеют собственной внутренней структуры, то сеть называется простой. Если вершины обладают внутренней структурой, сел называются иерархическими. Одно из основных отличий иерархических сетей от простых состоит в возможности разделить сеть на подсети (подпространства) и устанавливать отношения не только между вершинами, но между подпространствами
Основной особенностью семантической сети является ее целостность, не позволяющая разделить механизм вывода и базу знаний. Вывод решения получается путем следующей процедуры: строится подсеть, соответствующая вопросу, подсеть накладывается на необходимый участок обшей сети; на мосте искомой вершины проявляется ответ.
3 Фреймовая модель представления знаний
Фрейм - структура данных, предназначенная для представления не которой стандартной ситуации. С каждым фреймом ассоциируется разнообразная информация (в том числе и процедуры), например, информация о том, как пользоваться данным фреймом, каковы ожидаемые результаты выполнения фрейма, что делать, если ожидания не оправдались и т.п. Верхние уровни фрейма фиксированы и представляют сущности, всегда истинные а ситуации, описываемой данным фреймом. Нижние уровни заканчиваются слотами, которые заполняются конкретной информацией при вызове фрейма Фрейм вызывается системой по соответствию текущей ситуации. Фрейм, слоты, механизм их означивания описывают ситуацию в семантических (не синтаксических) понятиях. С каждым слотом фрейма связаны описания условий, которые должны быть соблюдены, чтобы произошло означивание слота. Родственные фреймы связываются в систему фреймов. Система содержит описание зависимостей между входящими в нее фреймами. Представление зависимостей в явном виде позволяет предсказать переход между состояниями.
Вывод во фреймовой модели основывается на процессе наследования. Поиск решения производится по следующей процедуре: выбор базового фрейма, отвечающего условиям задачи; ограничение значений слотов этого фрейма; анализ хранимых фреймов-экземпляров; сопоставление полученного фрейма и поставленной задачи.
2.6.Модели представления знаний: логическая, фреймовая, семантическая. Последовательность построения модели. Требования эксперта и проблемной области к построению модели.
Логическая модель знаний.
Особенности:
1 ПО разбита на набор правил «если … то».
1. Все правила должны выстраиваться в виде дерева.
2. Правила хранятся общим списком. Для выбора одного правила выбираются все.
3. Возможность прямого и обратного вывода. Прямой вывод: известна постановка задача и вопрос – «Нужно найти решение». Обратный вывод: известен вопрос и решение – Нужно построить логику принятия решения.
4. Принятие решений: на основании постановки задачи выбирается правило для выполнения, выполняется, изменяется состояние системы, ищется новое правило т.д. Решение ищется до тех пор, пока не найден ответ на вопрос пользователя или доступных правил больше нет.
Фреймовая модель знаний.
Особенности:
1. ПО разбита на набор рамок (шаблонов), называемых базовыми фреймами.
2. Базовые фреймы между собой могут быть соединены по сетевому или иерархическому принципу.
3. Каждый базовый фрейм имеет набор фреймов-экземпляров, описывающих реальные объекты.
4. Каждый фрейм состоит из: имя фала и набор слотов. Каждый слот состоит из : имя слота, область значения (диапазон или перечень значений), значения по умолчанию, присоединенная процедура (программа, относящаяся к данному фрейму).
5. Принятие решений – на вопрос пользователя ищется базовый фрейм (если фрейм не найден, делается запрос эксперта). Для найденного базового фрейма перебираются фреймы–экземпляры. Если нашелся фрейм-экземпляр, он выдается как ответ. Если нет, то значение базового фрейма сужается до ответа, нужного пользователю. При одобрении – это новый фрейм-экземпляр.
Семантическая (сетевая) модель знаний.
Особенности:
1. ПО разбита на объекты и свойства, которые равноправны между собой.
2. Все вершины расположены в виде сети, соединение возможно «Каждый с каждым».
3 . Типы связей: : - иерархический; - семантический;
- функциональный; - каузальный;
4. В одной модели могут быть разные типы связи, тогда ее разбивают по уровням. Каждому типу
свой уровень.
5. Принятие решений. На запрос пользователя строится сеть маска с отверстием вместо вопроса. Данная маска накладывается на первоначальную сеть. В отверстии проявляется ответ.
Преимущества: 1). Ограничений на ПО нет.
2). Легко воспринимается (соответствует образу мышлению).
3). Быстрое принятие решения.
Недостатки: 1). Сложная реализация.
2). Слишком широкое ПО.
3). Необходим дополнительный инструмент создания сети.
Требования эксперта и проблемной области к построению модели.
Приоритеты при выборе моделей.
Логическая модель | Фреймовая модель | Сетевая модель |
1. Все решения ПО алгоритмизированы. 2. Эксперты не принимают интуитивных решений. 3. Количество действий ограничено (количество методов у эксперта ограничено), внимание уделяется быстродействию. Не позволяет создать большую модель. 4. Существует система оценки правильного решения (эксперт должен знать правильное решение). | 1. ПО рассматривается в виде объектов. 2. Эксперт старается принимать интуитивное решение 3. Нет ограничений по ресурсам (аппаратные и программные средства). 4. Решений может быть несколько. | 1. Используется фактические данные. 2. Решение измеряемо. 3. Границы ПО фиксированы. 4. Информация хранится в виде БД. |