Глава 7 Теория экспертных систем
Предназначение экспертных систем
Системы искусственного интеллекта начали развиваться с развитием ЭВМ, но в силу недостаточности аппаратного обеспечения не получили распространения. Экспертные системы (ЭС) возникли на основе систем искусственного интеллекта (СИИ). ЭС появились как самостоятельное направление исследований в рамках СИИ. Цель создания ЭС состоит в разработке компьютерных программ, которые при решении трудных задач получают некоторые результаты, по своей эффективности превосходящие решения, полученные с помощью человека - эксперта. Специалисты в области ЭС стали называть эту область инженерия знаний.
ЭС предназначены для решения сложных неформализованных задач.
Особенности неформализуемых задач:
1) невозможность задания условий в цифровом виде;
2) нет целевой функции;
3) не существует алгоритмического решения задачи;
4) существует алгоритмическое решение задачи, но невозможно его использовать (не хватает ОЗУ, времени и т.д.);
5) характерно для неформализованных задач ошибочность, неоднозначность, противоречивость исходных данных;
6) огромная размерность задач (перебор альтернатив очень велик);
7) данные задачи изменяются в динамике.
Таким образом, ЭС и СИИ при решении задач отличаются от обычных систем следующим:
- в них используется символьный способ представления данных, в отличие от цифрового способа;
- используется эвристический и символьный способы решения задач, в отличие от алгоритмического.
Основные преимущества ЭС:
1) Технология ЭС значительно расширяет круг практически значимых задач, которые можно решить на ЭВМ и решение которых приносит значительный экономический эффект.
2) Технология ЭС является единственным средством в решении проблем традиционного программирования:
- длительность разработки;
- высокая стоимость разработки сложных приложений;
- высокая стоимость сопровождения сложных систем.
3) Объединение технологии ЭС с технологией традиционного программирования позволяет резко повысить качество программных продуктов (программные продукты могут выполняться пользователями).
4) ЭС могут играть основную роль на стадиях проектирование ИС, производства, распространения, продажи, оказание услуг в любых областях;
5) Технология ЭС может обеспечить революционный прорыв в интеграции приложений при решении любых сложных и неформализуемых задач.
Хотя ЭС предназначены для решения неформализуемых задач, в то же время они не отвергают традиционного подхода к проектированию компьютерных программ.
Специфика ЭС по отношению к другим СИИ состоит в том, что ЭС используется для решения очень сложных задач, однако по качеству и эффективности их решения не уступают решениям, полученным с помощью экспертов людей. При этом ЭС способны пополнять свои знания в ходе взаимодействия с экспертом человеком.
Архитектура ЭС
Экспертные системы подразделяются на статические и динамические. Типовая структура статической ЭС приведена на рис. 7.1.
Рисунок 7.1
Рабочая память (база данных) предназначена для хранения исходных и промежуточных данных в текущий момент решения задачи. База знаний предназначена для хранения долгосрочных данных, которые используются для решения задачи, для хранения правил, описывающих преобразование данных, которые имеются в базе знаний.
Решатель (интерпретатор) формирует последовательность правил, которые приводят к решению задач, использует данные из базы данных и базы знаний.
Компонент приобретения знаний предназначен для автоматизации приобретения знаний.
Объясняющий компонент объясняет каким образом система получила данное решение или объясняет почему ЭС не получила решение задачи. Объясняет, какие знания ЭС использовала для получения решения задачи.
Диалоговый компонент ориентирован для организации дружественного общения ЭС с пользователем в ходе решения задач, в процессе приобретения знаний и в процессе объяснения результатов решения задач.
Особенностью статических ЭС является то, что эти системы предназначены для решения задач без учета изменений, происходящих в окружающей среде во время решения задачи.
Динамические ЭС учитывают изменения, происходящие в окружающей среде в течение времени решения задачи.
Структура динамической ЭС приведена на рис. 7.2.
Рисунок 7.2
В создании и использовании ЭС участвуют следующие специалисты:
1) Эксперт в проблемной области задач, которые будут ставиться и решаться экспертной системой; руководитель, для которого создается ЭС. Основные функции эксперта: определение объема знаний (правил и данных), характеризующих проблемную область, полноты и правильности знаний, получаемых ЭС.
2) Инженер по знаниям - специалист по разработке ЭС (используется технология инженерии знаний). Инженер по знаниям осуществляет помощь для выявления и структуризации знаний, необходимых ЭС.
3) Программист - специалист по разработке инструментальных средств, программ поддержки и ускорения создания ЭС (замена инженера по знаниям - программистом).
ЭС работают в двух основных режимах:
1) Режим приобретения знаний. Общение с ЭС осуществляет человек-эксперт с помощью инженера по знаниям. Эксперт, используя «компонент приобретения знаний» пополняет ЭС знаниями. Эти знания позволяют ЭС в дальнейшем решать задачи без участия эксперта. Эксперт описывает проблемную область в виде совокупности правил и данных. Правила описывают способы взаимодействия с данными, характерными для данной области. Режиму приобретения знаний в традиционной системе соответствуют этапы: алгоритмизация, разработка программ, отладка программ. В отличие от обычной компьютерной системы в случае экспертных систем разработка программ осуществляется экспертом, который не владеет знаниями в области программирования.
2) Режим решения задачи (режим консультации). Общение с ЭС осуществляет конечный пользователь, которого интересует результат и способ получения результата.
Конечный пользователь может быть не специалистом в данной области. В таком случае он обращается к ЭС за результатом, поскольку не может получить его сам. Если конечный пользователь - специалист в данной области, он обращается к ЭС для того, чтобы ускорить получение результата, либо возложить на ЭС рутинную работу.
В режиме консультации данные о задаче после обработки их в диалоговом компоненте поступают в рабочую память. После этого решатель формирует решение задачи на основе входных данных из базы данных и общих данных по проблемной области и правил из базы знаний.
Если реакция ЭС непонятна пользователю, то он вправе потребовать от ЭС объяснения, почему система задает тот или иной вопрос, или каким образом получен системой тот или иной результат.
7.3 Особенности разработки экспертных систем
Разработка ЭС имеет существенные отличия от разработки обычного программного продукта. Опыт разработки ЭС показал, что использование методологии традиционного создания программ не подходит в данном случае по двум причинам:
1) чрезмерно затягивается процесс создания ЭС;
2) использование традиционной методологии создания программ приводит к отрицательному результату.
Особенность создания ЭС в первую очередь заключается в неформализованности задач, решаемых ЭС и в отсутствии теории создания ЭС. Эти две особенности приводят к необходимости постоянно совершенствовать принципы и способы построения ЭС в ходе процесса разработки в соответствии с увеличением объема знаний.
Таким образом, прежде чем приступить к созданию экспертных систем, инженер по знаниям обязан убедиться - следует ли разрабатывать ЭС для данной проблемной области. Разработка ЭС необходима тогда, когда мы можем эффективно использовать ЭС и когда при разработке ЭС мы можем использовать методы инженерии знаний.
Чтобы реализовать эти условия необходимо выполнение следующих требований:
1) В данной проблемной области существуют эксперты, которые решают задачи значительно лучше, чем средние специалисты.
2) Эти эксперты сходятся в оценке качества предлагаемого решения, или эксперты сходятся в оценке качества предполагаемой ЭС.
3) Эксперты способны выразить на естественном языке и объяснить используемые ими способы и методы таким образом, чтобы можно было их вложить в ЭВМ.
4) Решение задач в ЭС требует рассуждений, но не действий.
5) Обычная задача, решаемая ЭС не должна быть слишком трудной для эксперта человека, то есть решение должно занимать у эксперта несколько часов или дней.
6) Задача, которая решается ЭС, хотя и не формализована, должна быть структурирована, понятна для пользователя (должна выдавать основные понятия, отношения и известные эксперту способы решения).
7) Решение задачи в ЭС не должно в значительной мере использовать здравый смысл, потому, что рассуждения здравого смысла не удается вложить в СИИ.
Создание ЭС оправдано тогда, когда мы можем получить следующие выгоды:
1) Создание ЭС оправдано, если ее создание приносит значительный эффект, в том числе экономический.
2) Использование человека эксперта невозможно из-за недостаточного количества экспертов или из-за необходимости выполнять экспертизы одновременно в нескольких местах.
3) При передаче информации эксперту происходит значительная потеря объема и качества информации.
4) Есть необходимость решения задачи во враждебной окружающей среде.
Особенности задач решаемых ЭС:
1) Задача ставится и решается естественным образом с помощью манипуляции символами, а не с числами, что принято при традиционном создании программ.
2) Задача в ЭС имеет эвристическую природу, в отличие от алгоритмической. Если задача решается с помощью некоторых формальных процедур, то она не подходит для СИИ.
3) Задача должна быть достаточно сложной, чтобы оправдать значительные расходы на созданиеЭС.
Этапы разработки ЭС
Технология разработки экспертных систем включает в себя шесть основных этапов (рис. 7.3):
1) Идентификация.
2) Концептуализация.
3) Формализация.
4) Наполнение.
5) Опытная эксплуатация.
6) Тестирование.
Рисунок 7.3
1. На первом этапе определяются основные задачи, подлежащие разработке и решению, выявляются основные цели разработки ЭС, определяются основные эксперты, пользователи для которых создается ЭС. Идентификация – математическое описание.
2. На этапе концептуализации производится содержательное описание проблемной области. Если на этапе идентификации выделяются требования, то на этом этапе формируются понятия и их взаимосвязи. Определяются методы решения задач в ЭС.
3. Это начальный этап формализации. При создании ЭС:
- производится выбор инструментальных средств;
- производится выбор способов представления всех видов знаний;
- формализуются основные понятия;
- определяются способы интерпретации данных - модификации данных с целью вложения их в ЭВМ;
- моделирование работы системы в целом;
- оценка адекватности системы с моделью.
4. Наполнение экспертом базы знаний ЭС. В связи с тем, что основой ЭС являются знания, этот этап является наиболее трудоемким и наиболее важным:
- извлечение знаний из эксперта;
- организация знаний;
- представление знаний в виде понятном для ЭС.
Все это осуществляет инженер по знаниям вместе с экспертом и вводит эти знания в ЭС.
5. На этапе опытной эксплуатации исследуется пригодность ЭС для работы с пользователями. В результате этого этапа обычно появляется необходимость доработки ЭС.
6. Эксперт и инженер по знаниям оценивают компетентность ЭС – проводят тестирование. Обычно этот этап длится до тех пор, пока эксперт не придет к заключению, что ЭС достигла достаточного уровня компетентности.
Создание ЭС не сводится к строгой последовательности перечисленных этапов (рис. 7.3). Обычно разработчики ЭС требуют неоднократного возвращения к промежуточным и начальным этапам создания ЭС и пересмотра принимаемых на этих этапах решений.
Вопросы для самоконтроля к главе 7
1. Перечислите особенности неформализуемых задач
2. Отличие ЭС и СИИ при решении задач от обычных систем
3. Преимущества технологии ЭС
4.Отличие статической ЭС от динамической
5. Предназначение компонента приобретения знаний
6. Перечислите специалистов участвующих в создании и использовании ЭС
7. Опишите режимы работы ЭС
8. Какие требования являются условиями для разработки ЭС?
9. Особенности задач решаемых ЭС
10. Перечислите этапы разработки ЭС
11. В чем заключается этап наполнения
12. Почему необходимы возвращения к промежуточным и начальным этапам разработки ЭС?
Терминологический словарь
Адрес связи- атрибут, в котором хранится начальный адрес или номер записи, обрабатываемой после этой записи. Обычная последовательность обработки записей в списке определяется возрастанием значений ключа в записях.
Атрибут –единица информации,информационное отображение отдельного свойства некоторого объекта, процесса или явления.
Атрибут-основание - отображение количественного свойства некоторого объекта, предмета, процесса.
Атрибут-признак - информационное отображение качественного свойства некоторого объекта, предмета, процесса.
Ацикличность – процедура позволяющая улучшить характеристики БД, чтобы при корректировке или перестройке отношений не было двусмысленности или потери информации.
База данных (БД) - это набор форматированных сообщений,
Бинарное дерево – древовидная организация данных,когда значение ключевого атрибута каждой записи больше, чем значение ключа у любой записи на ее левой ветви, и не меньше, чем ключ любой записи на ее правой ветви.
Веерное отношение - называется пара отношений, состоящая из одного основного, одного зависимого отношения и связи между ними при условии, что каждое значение зависимого отношения связано с единственным значением основного отношения.
Вероятный ключотношения - такое множество атрибутов, что каждое сочетание их значений встречается только в одной строке отношения, и никакое подмножество атрибутов этим свойством не обладает. Вероятных ключей в отношении может быть несколько.
Взаимодействие объектов - факт участия нескольких объектов в каком-либо процессе, который протекает и во времени, и в пространстве.
Внутреннее описание - определяет организацию данных в памяти ЭВМ и методы доступа к данным.
Время поиска данных - нахождение значения ключевого атрибута равного заранее известной величине.
Время корректировки данных - т.е. включение или исключение одной записи.
ВС – вычислительная система.
Выборка - операция выделения подмножества значений СЕИ (строк), которые удовлетворяют заранее поставленным условиям выборки.
Дескриптор – доминанта в классе условной эквивалентности, то есть такой термин, который может заменить любое слово класса.
Документ - материальный носитель информации, содержащий оформленное в установленном порядке сообщение и имеющий юридическую силу.
Домен – множество всех допустимых значений атрибута
Древовидная организация данных (дерево) – метод организации данных, множество записей расположены определенным образом по уровням:
- на 1-м уровне расположена только одна запись (корень дерева),
- к любой записи i-го уровня ведет адрес связи только от одной записи уровня i-1.
Единицы информации -набор символов, которому придается определенный смысл (атрибуты и составные единицы информации).
Идентифицирующие свойства - свойства, по значению которых можно однозначно отличить данный экземпляр объекта от любого другого (в том числе и в пределах класса объектов, содержащего этот экземпляр).
Иерархическая база данных - множество отношений и веерных отношений, для которых соблюдаются два ограничения:
1) существует единственное отношение, называемое корневым, которое не является зависимым ни в одном веерном отношении.
2) все остальные отношения (за исключением корневого) являются зависимыми отношениями только в одном веерном отношении.
Иерархическая модель данных – модель данных, допустимыми информационными конструкциями которой являются отношение, веерное отношение и иерархическая база данных.
Индексирование - выражение тем на языке, принятом в информационно-поисковой системе, и записи в виде поисковых образов, которые связываются с документом.
Информация – ресурсы; новые сведения, позволяющие улучшить процессы, связанные с преобразованием вещества, энергии и самой информации, принятые, понятые и оцененные конечным потребителем как полезные
Концептуальная схема - описание структуры всех единиц информации, хранящихся в БД.
Концептуальное представление - информационное содержание базы данных в абстрактной форме. Цель концептуального уровня - создать такое формальное представление о базе данных, чтобы любое внешнее представление являлось его подмножеством.
Корректировка - включение и исключение записей
КУЭ -классы условной эквивалентности.
Коэффициент мультипрограммирования - число одновременно выполняемых заданий в ВС.
Неполная функциональная зависимость - это две зависимости:
- вероятный ключ отношения функционально определяет некоторый неключевой атрибут,
- часть вероятного ключа функционально определяет этот же неключевой атрибут.
Нормализация - это операция перехода от СЕИ с произвольной структурой к СЕИ с двухуровневой структурой, позволяющая улучшить характеристики БД по минимальность избыточности представления информации.
Объект - любой элемент некоторой системы. В экономических приложениях это любой предмет, занимающий место в пространстве.
Омонимия - совпадение в звучании и написании разных слов. Например: лук (растение) и лук (оружие).
Организация значений данных - относительно устойчивый порядок расположения записей данных в памяти ЭВМ и способ обеспечения взаимосвязи между данными.
Отношение – таблица, с двухуровневой структурой.
Отношение в первой нормальной форме (1 НФ) - это обычное отношение с двухуровневой структурой. Недопустимость в структуре отношения третьего и последующих уровней является ограничением, определяющим 1НФ отношения.
Отношение во второй нормальной форме (2НФ) - если оно соответствует 1НФ и не содержит неполных функциональных зависимостей.
Отношение в третьей нормальной форме (3НФ)- если оно соответствует 2НФ и среди его атрибутов отсутствуют транзитивные функциональные зависимости (ФЗ).
Пакетный режим обработки - данные в системе накапливаются до тех пор, пока не наступит заданный момент времени, или объем данных не превысит некоторый предел. Затем имеющаяся информация обрабатывается несколькими последовательно запускаемыми программами.
Первичный ключ отношения - такой вероятный ключ, по значениям которого производится контроль достоверности информации в отношении.
Поиск - процедура выделения из некоторого множества записей определенного подмножества, записи которого удовлетворяют некоторому заранее поставленному условию.
Показатель - представляет собой полное описание количественного параметра, характеризующего некоторый объект или процесс.
Полисемия - перенос названия одного предмета на другие предметы. Например: звезда (геометрическая фигура) и звезда (небесное тело).
Порядковая система кодирования – нумерация, применяемая, если классификация объектов вообще не требуется.
Последовательная организация данных – метод организации данных, когда записи располагаются в памяти строго одна за другой, без промежутков.
Предметная область - элементы материальной системы (объект, свойства объектов, взаимодействие объектов, свойства взаимодействия объектов), информация о которых хранится и обрабатывается в ЭИС.
Проекция – операция переноса в результирующее отношение тех столбцов исходного отношения, которые указаны в условии операции.
Простейшие СЕИ - таблицы, позволяющие создавать произвольные комбинации из атрибутов.
Процесс управления в ЭИС - процесс изменения состояния объекта, которое приводит к достижению поставленной цели. Объектом управления является экономическая система, обладающая сложной, многоуровневой иерархической структурой.
Разработка (проектирование) ЭИС - процесс составления описания еще не существующей системы на разных языках и с различной степенью детализации, в ходе которого осуществляется оптимизация проектных решений.
Реляционная база данных - модель данных, характеризующаяся следующими компонентами:
- информационной конструкцией - отношением с двухуровневой структурой,
- допустимыми операциями - проекцией, выборкой, соединением и другими
- ограничениями - функциональными зависимостями между атрибутами отношения.
Разрядная система кодирования – классификация объектов по нескольким признакам и их взаимная подчиненность соответствует выделению классов объектов, подклассов внутри каждого класса и т.д.
Свертка - операция преобразования СЕИ с двухуровневой структурой в СЕИ с произвольной многоуровневой структурой.
Свойство объекта - некоторая величина, которая характеризует состояние объекта в любой момент времени. Отдельный экземпляр объекта можно точно описать, если указать достаточное количество значений его свойств.
Свойство взаимодействия - характеризует совместное поведение объектов, но не относится ни к одному объекту в отдельности.
Семантические модели - средство представления структуры предметной области.
Семантические сети - модель знаний, состоящая в единстве базы знаний и механизма вывода новых фактов. На основании вопроса к базе знаний строится семантическая сеть, отображающая структуру вопроса, и ответ получается в результате сопоставления общей сети для базы знаний в целом и сети для вопроса.
Серийная система кодирования – классификация объектов по одному признаку. Коды объектов разделяются на несколько частей (серий) по количеству значений этого признака и в пределах каждой серии использовать последовательные номера.
Сетевая база данных – модель данных, состоящая из множества отношений и веерных отношений. Отношения разделяются на основные и зависимые.
Синонимия- одному "означаемому" (предмету, явлению) соответствует одно и более "означающих" (слов, словосочетаний).
Система –любой объект, который, с одной стороны, рассматривается как единое целое, а с другой - как множество связанных между собой или взаимодействующих составных частей.
Слот фрейма - элемент данных, предназначенный для фиксации знаний об объекте, которому отведен данный фрейм.
Составная единица информации (СЕИ) - набор из атрибутов и, возможно, других СЕИ. Простейшая СЕИ – таблица.
Система управления базой данных (СУБД) - комплекс программ, обеспечивающий централизованное хранение, накопление, модификацию и выдачу данных, входящих в БД.
Структура СЕИ - вхождение одних единиц информации в состав других единиц информации
Тезаурус -словарь-справочник, в котором перечислены все лексические единицы ИМЯ с синонимичными им словами, а также выражены все важнейшие смысловые (парадигматические) отношения между лексическими единицами.
Транзитивная ФЗ - это две ФЗ:
- вероятный ключ отношения функционально определяет не ключевой атрибут,
- этот атрибут функционально определяет другой не ключевой атрибут.
ФЗ – функциональная зависимость.
Формирование данных - процедура упорядочения записей по ключевому атрибуту.
Продукционная модель– модель знаний, состоящая из набора правил и механизма логического вывода. Все правила содержат условную и заключительную части. В условной части правила находится одиночный факт либо несколько фактов. В заключительной части правила находятся факты, которые необходимо дополнительно сформировать в рабочей памяти, если условная часть правила является истинной.
Фреймы – модель знаний, структура знаний в памяти ЭВМсопоставимая с рамками, определенными для каждого объекта в сознании человека. С помощью фреймов мы пытаемся представить процесс систематизации знаний в форме, максимально близкой к принципам систематизации знаний человеком.
Цель информационной системы - управление экономическими процессами.
Экономическая информация - информация о процессах производства, распределения, обмена и потребления материальных благ.
Экономическая информационная система - система, функционирование которой во времени заключается в сборе, хранении, обработке и выдачи информации о деятельности какого-то экономического объекта реальногомира.
Эмерджентность - свойство системы обладать большими свойствами, чем составляющие ее элементы.
Литература
1. Горбенко, А. О. Информационные системы в экономике [Текст] : учебное пособие для вузов / А. О. Горбенко. - М. : БИНОМ : Лаб. знаний, 2010. - 292 с.
2. Григоренко Г.П., Даниленко Т.Я. Системы автоматизированной обработки информации (САОЭИ) [Текст] : учебное пособие. –М.: МЭСИ, 1996.
- Димов Э.М. Теория экономических информационных систем [Текст] : учебное пособие / Э. М. Димов. - Самара : ПГАТИ, 1998. - 37 с.
4. Иватилов Ю.П., Лотов А.В. Математические модели в экономике. [Текст]: учебное пособие под ред. академика Моисеева Н.Н.. –М.: Наука, 1979.
- Информационные системы в экономике[Текст] : учебник под ред. В.В.Дика. – М.: Финансы и статистика, 1996. –272 с.
- Информационные системы в экономике [Текст] : учебное пособие для вузов / под ред. А.Н. Романова, Б.Е. Одинцова. – Изд. 2-е, доп. и перераб.. – М.: Вузовский учебник, 2008. – 411 с.
- Кордонская И.Б., Диязитдинова А.Р. Детализированное описание организационной структуры компании [Текст] : методическая разработка для выполнения контрольной работы по ТЭИС. Изд. ПГАТИ, 15 с.
8. Криницкий Н.А. Автоматизированные информационные системы [Текст]: Н.А.Криницкий Н.А., А.Г.Миронов, Д.Г.Фролов под ред. академика Дородницина А.А. –М.: Наука, 1982.
9. Мисарович М. Теория иерархических информационных систем [Текст] : М.Мисарович, Д.Марко, И.Такахара, пер. с англ. –М.: Мир, 1973.
- Мишенин А.И. Теория экономических информационных систем[Текст] : учебник. – 4 изд. – М.: Финансы и статистика, 1999. – 240 с.
11. Исаев, Г. Н. Информационные системы в экономике [Текст] : учебное пособие для вузов / Г. Н. Исаев. - М. : Омега-Л, 2006. - 462 с. : ил. - (Высшее экономическое образование)
12. Попов Э.В. Статические и динамические экспертные системы [Текст] : Э.В.Попов, И.Б.Фоминых, Е.Б.Кисель, М.Д.Шапот, учебное пособие, -М.: Финансы и статистика, 1996.
13. Якубайтис Э.Я. Информационные сети и системы [Текст]: справочная книга. М.: Финансы и статистика, 1996.