Глава 7 Теория экспертных систем

Предназначение экспертных систем

Системы искусственного интеллекта начали развиваться с развитием ЭВМ, но в силу недостаточности аппаратного обеспечения не получили распространения. Экспертные системы (ЭС) возникли на основе систем искусственного интеллек­та (СИИ). ЭС появились как самостоятельное направление исследований в рамках СИИ. Цель создания ЭС состоит в разработке компьютерных про­грамм, которые при решении трудных задач получают некоторые результаты, по своей эффективности превосходящие ре­шения, полученные с помощью человека - эксперта. Специалисты в области ЭС стали называть эту область инженерия знаний.

ЭС предназначены для решения сложных неформализованных задач.

Особенности неформализуемых задач:

1) невозможность задания условий в цифровом виде;

2) нет целевой функции;

3) не существует алгоритмического решения задачи;

4) существует алгоритмическое решение задачи, но невозможно его использовать (не хватает ОЗУ, времени и т.д.);

5) характерно для неформализованных задач ошибочность, неоднозначность, противоречивость исходных данных;

6) огромная размерность задач (перебор альтернатив очень велик);

7) данные задачи изменяются в динамике.

Таким образом, ЭС и СИИ при решении задач отличаются от обычных систем следующим:

- в них используется символьный способ представления данных, в отличие от цифрового способа;

- используется эвристический и символьный способы решения задач, в отличие от алгоритмического.

Основные преимущества ЭС:

1) Технология ЭС значительно расширяет круг практически значи­мых задач, которые можно решить на ЭВМ и решение которых приносит значительный экономический эффект.

2) Технология ЭС является единственным средством в решении проблем традиционного программирования:

- длительность разработки;

- высокая стоимость разработки сложных приложений;

- высокая стоимость сопровождения сложных систем.

3) Объединение технологии ЭС с технологией традиционного программирования позволяет резко повысить качество программных продуктов (программные продукты могут выполняться пользователями).

4) ЭС могут играть основную роль на стадиях проектирование ИС, производства, распространения, продажи, оказание услуг в любых областях;

5) Технология ЭС может обеспечить революционный прорыв в интеграции приложений при решении любых сложных и неформализуемых задач.

Хотя ЭС предназначены для решения неформализуемых задач, в то же время они не отвергают традиционного подхода к проектированию компьютерных программ.

Специфика ЭС по отношению к другим СИИ состоит в том, что ЭС используется для решения очень сложных задач, однако по качеству и эффектив­ности их решения не уступают решени­ям, полученным с помощью экспертов людей. При этом ЭС способны пополнять свои знания в ходе взаимодействия с экспер­том человеком.

Архитектура ЭС

Экспертные системы подразделяются на статические и динамические. Типовая структура статической ЭС приведена на рис. 7.1.

Глава 7 Теория экспертных систем - student2.ru

Рисунок 7.1

Рабочая память (база данных) предназначена для хранения исход­ных и промежуточных данных в текущий момент решения задачи. База знаний предназначена для хранения долгосрочных данных, которые используются для решения задачи, для хранения правил, описывающих преобразование данных, которые имеются в базе знаний.

Решатель (интерпретатор) формирует последовательность правил, которые приводят к решению задач, использует данные из базы данных и базы знаний.

Компонент приобретения знаний предназначен для автоматиза­ции приобретения знаний.

Объясняющий компонент объясняет каким образом система полу­чила данное решение или объясняет почему ЭС не получила реше­ние задачи. Объясняет, какие знания ЭС использовала для получе­ния решения задачи.

Диалоговый компонент ориентирован для организации дружест­венного общения ЭС с пользователем в ходе решения задач, в процессе приобретения знаний и в процессе объяснения результа­тов решения задач.

Особенностью статических ЭС является то, что эти системы предназначены для решения задач без учета изменений, происходящих в окружающей среде во время решения задачи.

Динамические ЭС учитывают изменения, происходящие в окру­жающей среде в течение времени решения задачи.

Структура динамической ЭС приведена на рис. 7.2.

Глава 7 Теория экспертных систем - student2.ru

Рисунок 7.2

В создании и использовании ЭС участвуют следующие специалисты:

1) Эксперт в проблемной области задач, которые будут ставиться и решаться экспертной системой; руководитель, для которого созда­ется ЭС. Основные функции эксперта: определение объема знаний (правил и данных), характеризующих проблемную область, полноты и правиль­ности знаний, получаемых ЭС.

2) Инженер по знаниям - специалист по разработке ЭС (использует­ся технология инженерии знаний). Инженер по знаниям осуществляет помощь для выявления и структуризации знаний, необходимых ЭС.

3) Программист - специалист по разработке инструментальных средств, программ поддержки и ускорения создания ЭС (замена инженера по знаниям - программистом).

ЭС работают в двух основных режимах:

1) Режим приобретения знаний. Общение с ЭС осуществляет человек-эксперт с помощью инженера по знаниям. Эксперт, используя «компонент приобретения знаний» пополняет ЭС знаниями. Эти знания позволяют ЭС в дальнейшем решать задачи без участия эксперта. Экс­перт описывает проблемную область в виде совокупности правил и данных. Правила описывают способы взаимодействия с данны­ми, характерными для данной области. Режиму приобретения знаний в традиционной системе соответствуют эта­пы: алгоритмизация, разработка программ, отладка программ. В отличие от обычной компьютерной системы в случае экспертных систем разработка программ осуществляется экспертом, который не владеет знаниями в области программирования.

2) Режим решения задачи (режим консультации). Общение с ЭС осу­ществляет конечный пользователь, которого интересует результат и способ получения результата.

Конечный пользователь может быть не специалистом в данной об­ласти. В таком случае он обращается к ЭС за результатом, поскольку не может получить его сам. Если конечный пользователь - специалист в данной области, он обращает­ся к ЭС для того, чтобы ускорить получение результата, либо возло­жить на ЭС рутинную работу.

В режиме консультации данные о задаче после обработки их в диа­логовом компоненте поступают в рабочую память. После этого решатель формирует решение задачи на основе входных данных из базы данных и общих данных по проблемной области и правил из базы знаний.

Если реакция ЭС непонятна пользователю, то он вправе по­требовать от ЭС объяснения, почему система задает тот или иной во­прос, или каким образом получен системой тот или иной результат.

7.3 Особенности разработки экспертных систем

Разработка ЭС имеет существенные отличия от разработки обычного программного продукта. Опыт разработки ЭС показал, что использование методологии традиционного создания программ не подходит в данном случае по двум причинам:

1) чрезмерно затягивается процесс создания ЭС;

2) использование традиционной методологии создания программ приводит к отрицательному результату.

Особенность создания ЭС в первую очередь заключается в неформа­лизованности задач, решаемых ЭС и в отсутствии теории создания ЭС. Эти две особенности приводят к необходимости постоянно совершенствовать принципы и способы построения ЭС в ходе процесса разработки в соответ­ствии с увеличением объема знаний.

Таким образом, прежде чем присту­пить к созданию экспертных систем, инженер по знаниям обязан убедиться - следует ли разрабатывать ЭС для данной проблемной области. Разработ­ка ЭС необходима тогда, когда мы можем эффективно использовать ЭС и когда при разработке ЭС мы можем использовать методы инженерии зна­ний.

Чтобы реализовать эти условия необходимо выполнение следующих требований:

1) В данной проблемной области существуют эксперты, которые ре­шают задачи значительно лучше, чем средние специалисты.

2) Эти эксперты сходятся в оценке качества предлагаемого решения, или эксперты сходятся в оценке качества предполагаемой ЭС.

3) Эксперты способны выразить на естественном языке и объяснить используемые ими способы и методы таким образом, чтобы мож­но было их вложить в ЭВМ.

4) Решение задач в ЭС требует рассуждений, но не действий.

5) Обычная задача, решаемая ЭС не должна быть слишком трудной для эксперта человека, то есть решение должно занимать у экс­перта несколько часов или дней.

6) Задача, которая решается ЭС, хотя и не формализована, должна быть структурирована, понятна для пользователя (должна выдавать основные понятия, отношения и известные экс­перту способы решения).

7) Решение задачи в ЭС не должно в значительной мере использо­вать здравый смысл, потому, что рассуждения здравого смысла не удается вложить в СИИ.

Создание ЭС оправдано тогда, когда мы можем получить следую­щие выгоды:

1) Создание ЭС оправдано, если ее создание приносит значительный эффект, в том числе экономический.

2) Использование человека эксперта невозможно из-за недостаточ­ного количества экспертов или из-за необходимости выполнять экспертизы одновременно в нескольких местах.

3) При передаче информации эксперту происходит значительная по­теря объема и качества информации.

4) Есть необходимость решения задачи во враждебной окружающей среде.

Особенности задач решаемых ЭС:

1) Задача ставится и решается естественным образом с помощью ма­нипуляции символами, а не с числами, что принято при традици­онном создании программ.

2) Задача в ЭС имеет эвристическую природу, в отличие от алгоритмической. Если задача решается с помощью некоторых формаль­ных процедур, то она не подходит для СИИ.

3) Задача должна быть достаточно сложной, чтобы оправдать зна­чительные расходы на созданиеЭС.

Этапы разработки ЭС

Технология разработки экспертных систем включает в себя шесть ос­новных этапов (рис. 7.3):

1) Идентификация.

2) Концептуализация.

3) Формализация.

4) Наполнение.

5) Опытная эксплуатация.

6) Тестирование.

Глава 7 Теория экспертных систем - student2.ru

Рисунок 7.3

1. На первом этапе определяются основные задачи, подлежащие разра­ботке и решению, выявляются основные цели разработки ЭС, оп­ределяются основные эксперты, пользователи для которых созда­ется ЭС. Идентификация – математическое описание.

2. На этапе концептуализации производится содержательное описание про­блемной области. Если на этапе идентификации выделяются тре­бования, то на этом этапе формируются понятия и их взаимосвязи. Определяются методы решения задач в ЭС.

3. Это начальный этап формализации. При создании ЭС:

- производится выбор инструментальных средств;

- производится выбор способов представления всех видов знаний;

- формализуются основные понятия;

- определяются способы интерпретации данных - модифика­ции данных с целью вложения их в ЭВМ;

- моделирование работы системы в целом;

- оценка адекватности системы с моделью.

4. Наполнение экспертом базы знаний ЭС. В связи с тем, что осно­вой ЭС являются знания, этот этап является наиболее трудоемким и наиболее важным:

- извлечение знаний из эксперта;

- организация знаний;

- представление знаний в виде понятном для ЭС.

Все это осуществляет инженер по знаниям вместе с экспертом и вводит эти знания в ЭС.

5. На этапе опытной эксплуатации исследуется пригодность ЭС для работы с пользователями. В ре­зультате этого этапа обычно появляется необходимость доработ­ки ЭС.

6. Эксперт и инженер по знаниям оценивают компетентность ЭС – проводят тестирование. Обычно этот этап длится до тех пор, пока эксперт не придет к за­ключению, что ЭС достигла достаточного уровня компетентно­сти.

Создание ЭС не сводится к строгой последовательности перечислен­ных этапов (рис. 7.3). Обычно разработчики ЭС требуют неоднократного возвращения к промежуточным и начальным этапам создания ЭС и пересмотра принимаемых на этих этапах решений.

Вопросы для самоконтроля к главе 7

1. Перечислите особенности неформализуемых задач

2. Отличие ЭС и СИИ при решении задач от обычных систем

3. Преимущества технологии ЭС

4.Отличие статической ЭС от динамической

5. Предназначение компонента приобретения знаний

6. Перечислите специалистов участвующих в создании и использовании ЭС

7. Опишите режимы работы ЭС

8. Какие требования являются условиями для разработки ЭС?

9. Особенности задач решаемых ЭС

10. Перечислите этапы разработки ЭС

11. В чем заключается этап наполнения

12. Почему необходимы возвращения к промежуточным и начальным этапам разработки ЭС?

Терминологический словарь

Адрес связи- атрибут, в котором хранится на­чальный адрес или номер записи, обрабатываемой после этой записи. Обычная последовательность обработки записей в списке определяется возрастанием значений ключа в записях.

Атрибут –единица информации,информационное отображение от­дельного свойства некоторого объекта, процесса или явления.

Атрибут-основание - отображение количественного свойства некоторого объекта, предмета, процесса.

Атрибут-признак - информационное отображение качественного свойства некоторого объекта, предмета, процесса.

Ацикличность – процедура позволяющая улучшить характеристики БД, чтобы при корректировке или перестройке отношений не было двусмысленности или потери информации.

База данных (БД) - это набор форматированных сообщений,

Бинарное дерево – древовидная организация данных,когда значение ключевого атри­бута каждой записи больше, чем значение ключа у любой записи на ее левой ветви, и не меньше, чем ключ любой записи на ее правой ветви.

Веерное отношение - называется пара отношений, состоящая из одного основного, одного зависимого отноше­ния и связи между ними при условии, что каждое значение зависимого отношения связано с единственным значением ос­новного отношения.

Вероятный ключотношения - такое множество атрибутов, что каждое сочетание их значений встречается только в одной строке отношения, и никакое подмножество атрибутов этим свойством не обладает. Вероятных ключей в отношении может быть несколько.

Взаимодействие объек­тов - факт участия нескольких объектов в каком-либо процессе, который протекает и во времени, и в пространстве.

Внутреннее описание - определяет организацию дан­ных в памяти ЭВМ и методы доступа к данным.

Время поиска данных - нахождение значения ключевого атрибута равного заранее известной величине.

Время корректировки данных - т.е. включение или исклю­чение одной записи.

ВС – вычислительная система.

Выборка - операция выделения подмножества значений СЕИ (строк), которые удовлетворяют заранее поставленным услови­ям выборки.

Дескриптор – доминанта в классе условной экви­валентности, то есть такой термин, который может заменить любое слово клас­са.

Документ - материальный носитель информации, содержащий оформленное в установленном порядке сообщение и имеющий юридическую силу.

Домен – множество всех допустимых значений атрибута

Древовидная организация данных (дерево) – метод организации данных, множество записей расположены определенным образом по уровням:

- на 1-м уровне расположена только одна запись (корень дерева),

- к любой записи i-го уровня ведет адрес связи только от одной записи уровня i-1.

Единицы информации -набор символов, которо­му придается определенный смысл (атрибуты и составные единицы информации).

Идентифицирующие свойства - свойства, по значению которых можно однозначно отличить данный экземпляр объекта от любого другого (в том числе и в пределах класса объектов, содержащего этот экземпляр).

Иерархическая база данных - множество отношений и веерных отношений, для которых соблюдаются два ограничения:

1) существует единственное отношение, называемое корневым, которое не является зависимым ни в одном веерном отношении.

2) все остальные отношения (за исключением корневого) яв­ляются зависимыми отношениями только в одном веерном отно­шении.

Иерархическая модель данных – модель данных, допустимыми информационными конст­рукциями которой являются отношение, веерное отношение и иерархическая база данных.

Индексирование - выражение тем на языке, принятом в информацион­но-поисковой системе, и записи в виде поисковых обра­зов, которые связываются с документом.

Информация – ресурсы; новые сведения, позволяющие улучшить про­цессы, связанные с преобразованием вещества, энергии и самой информации, принятые, понятые и оценен­ные конечным потребителем как полезные

Концептуальная схема - описание структуры всех единиц информации, хранящихся в БД.

Концептуальное представление - инфор­мационное содержание базы данных в абстрактной фор­ме. Цель концептуального уровня - создать такое формальное представление о базе данных, чтобы любое внешнее представ­ление являлось его подмножеством.

Корректировка - включение и исключение записей

КУЭ -классы условной эквива­лентности.

Коэффи­циент мультипрограммирования - число одновременно выполняемых заданий в ВС.

Неполная функциональная зависимость - это две зависимости:

- вероятный ключ отношения функционально определяет некоторый неключевой атрибут,

- часть вероятного ключа функционально определяет этот же неключевой атрибут.

Нормализация - это операция перехода от СЕИ с произ­вольной структурой к СЕИ с двухуровневой структурой, позволяющая улучшить характеристики БД по минимальность избыточности представления информации.

Объект - любой элемент некоторой системы. В экономических приложениях это любой предмет, занимающий место в пространстве.

Омонимия - совпадение в звучании и написании раз­ных слов. Например: лук (растение) и лук (оружие).

Организация значений данных - относительно устойчивый порядок расположения записей данных в памяти ЭВМ и способ обеспечения взаимосвязи между данными.

Отношение – таблица, с двухуровневой структурой.

Отношение в первой нормальной форме (1 НФ) - это обычное отношение с двухуровневой структурой. Недопустимость в структуре отношения третьего и последующих уровней является ограничением, определяющим 1НФ отношения.

Отношение во второй нормальной форме (2НФ) - если оно соответствует 1НФ и не содержит неполных функциональных зависимостей.

Отношение в третьей нормальной форме (3НФ)- если оно соответствует 2НФ и среди его атрибутов отсутствуют транзитивные функциональные зависимости (ФЗ).

Пакетный режим обработки - данные в системе накапли­ваются до тех пор, пока не наступит заданный момент времени, или объем данных не превысит некоторый предел. Затем имею­щаяся информация обрабатывается несколькими последователь­но запускаемыми программами.

Первичный ключ отношения - такой вероятный ключ, по значениям которого производится контроль достоверности информации в отношении.

Поиск - процедура выделения из некоторого множества записей определенного подмножества, записи ко­торого удовлетворяют некоторому заранее поставленному условию.

Показатель - представляет собой полное описание количе­ственного параметра, характеризующего некоторый объект или процесс.

Полисемия - перенос названия одного предмета на дру­гие предметы. Например: звезда (геометричес­кая фигура) и звезда (небесное тело).

Порядковая система коди­рования – нумерация, применяемая, если классификация объектов вообще не требуется.

Последовательная организа­ция данных – метод организации данных, когда записи располагаются в памяти строго одна за дру­гой, без промежутков.

Предметная область - элементы материальной системы (объект, свойства объектов, взаимодействие объектов, свойства взаимодействия объектов), информация о которых хранится и обрабатывается в ЭИС.

Проекция – операция переноса в резуль­тирующее отношение тех столбцов исходного отношения, кото­рые указаны в условии операции.

Простейшие СЕИ - таблицы, позволяющие создавать произвольные ком­бинации из атрибутов.

Процесс управления в ЭИС - процесс изменения состояния объекта, которое приводит к достижению поставленной цели. Объектом управления является экономическая система, обладающая сложной, многоуровневой иерархической структурой.

Разработка (проектирование) ЭИС - процесс составления описания еще не существующей системы на разных языках и с различной степенью детализа­ции, в ходе которого осуществляется оптимизация проектных решений.

Реляционная база данных - модель данных, характеризующаяся следующими компонентами:

- информационной конструкцией - отношением с двух­уровневой структурой,

- допустимыми операциями - проекцией, выборкой, соеди­нением и другими

- ограничениями - функциональными зависимостями меж­ду атрибутами отношения.

Разрядная система кодирования – классификация объектов по нескольким призна­кам и их взаимная подчиненность соответствует выделению классов объектов, подклассов внутри каждого класса и т.д.

Свертка - операция преобразования СЕИ с двухуровне­вой структурой в СЕИ с произвольной многоуровневой струк­турой.

Свойство объекта - некоторая величина, кото­рая характеризует состояние объекта в любой момент време­ни. Отдельный экземпляр объекта можно точно описать, если указать достаточное количество значений его свойств.

Свойство взаимодействия - характеризует совместное поведение объектов, но не от­носится ни к одному объекту в отдельности.

Семантические модели - средство представления структуры предметной области.

Семантические сети - модель знаний, состоящая в единстве базы знаний и механизма вывода новых фактов. На основании вопроса к базе знаний строится семантическая сеть, отображающая структуру вопроса, и ответ получается в результате сопоставления общей сети для базы знаний в це­лом и сети для вопроса.

Серийная система кодирования – классификация объектов по одно­му признаку. Коды объектов разделяются на несколько частей (серий) по количеству значений этого при­знака и в пределах каждой серии использовать последователь­ные номера.

Сетевая база данных – модель данных, состоящая из множества отношений и ве­ерных отношений. Отношения разделяются на основные и за­висимые.

Синонимия- одному "означаемому" (предмету, явлению) соответ­ствует одно и более "означающих" (слов, словосочетаний).

Система –любой объект, который, с одной сто­роны, рассматривается как единое целое, а с другой - как мно­жество связанных между собой или взаимодействующих со­ставных частей.

Слот фрейма - элемент данных, предназначенный для фиксации зна­ний об объекте, которому отведен данный фрейм.

Составная единица информации (СЕИ) - набор из атрибутов и, возможно, других СЕИ. Простейшая СЕИ – таблица.

Система управления базой данных (СУБД) - комплекс программ, обеспечивающий централизованное хранение, накопление, модификацию и выдачу данных, входящих в БД.

Структура СЕИ - вхождение од­них единиц информации в состав других единиц информации

Тезаурус -словарь-справочник, в котором перечисле­ны все лексические единицы ИМЯ с синонимичными им сло­вами, а также выражены все важнейшие смысловые (парадигматические) отноше­ния между лексическими единицами.

Транзитивная ФЗ - это две ФЗ:

- вероятный ключ отношения функционально определяет не ключевой атрибут,

- этот атрибут функционально определяет другой не ключевой атрибут.

ФЗ – функциональная зависимость.

Формирование данных - процедура упорядочения записей по ключевому атрибуту.

Продукционная модель– модель знаний, состоящая из набора правил и механизма логического вывода. Все правила содержат условную и заключительную части. В условной части правила находится одиночный факт либо несколько фактов. В заключительной части правила находятся факты, кото­рые необходимо дополнительно сформировать в рабочей па­мяти, если условная часть правила является истинной.

Фреймы – модель знаний, структура знаний в памяти ЭВМсопоставимая с рамками, определенными для каждого объекта в сознании человека. С по­мощью фреймов мы пытаемся представить процесс система­тизации знаний в форме, максимально близкой к принципам систематизации знаний человеком.

Цель информационной системы - управление экономическими про­цессами.

Экономичес­кая информация - информация о процессах производ­ства, распределения, обмена и потребления материальных благ.

Экономическая информационная система - система, функционирование которой во времени заклю­чается в сборе, хранении, обработке и выдачи ин­формации о деятельности какого-то экономического объекта реальногомира.

Эмерджентность - свойство системы обладать большими свойствами, чем составляющие ее элементы.

Литература

1. Горбенко, А. О. Информационные системы в экономике [Текст] : учебное пособие для вузов / А. О. Горбенко. - М. : БИНОМ : Лаб. знаний, 2010. - 292 с.

2. Григоренко Г.П., Даниленко Т.Я. Системы автоматизированной обработки информации (САОЭИ) [Текст] : учебное пособие. –М.: МЭСИ, 1996.

  1. Димов Э.М. Теория экономических информационных систем [Текст] : учебное пособие / Э. М. Димов. - Самара : ПГАТИ, 1998. - 37 с.

4. Иватилов Ю.П., Лотов А.В. Математические модели в экономике. [Текст]: учебное пособие под ред. академика Моисеева Н.Н.. –М.: Наука, 1979.

  1. Информационные системы в экономике[Текст] : учебник под ред. В.В.Дика. – М.: Финансы и статистика, 1996. –272 с.
  2. Информационные системы в экономике [Текст] : учебное пособие для вузов / под ред. А.Н. Романова, Б.Е. Одинцова. – Изд. 2-е, доп. и перераб.. – М.: Вузовский учебник, 2008. – 411 с.
  3. Кордонская И.Б., Диязитдинова А.Р. Детализированное описание организационной структуры компании [Текст] : методическая разработка для выполнения контрольной работы по ТЭИС. Изд. ПГАТИ, 15 с.

8. Криницкий Н.А. Автоматизированные информационные системы [Текст]: Н.А.Криницкий Н.А., А.Г.Миронов, Д.Г.Фролов под ред. академика Дородницина А.А. –М.: Наука, 1982.

9. Мисарович М. Теория иерархических информационных систем [Текст] : М.Мисарович, Д.Марко, И.Такахара, пер. с англ. –М.: Мир, 1973.

  1. Мишенин А.И. Теория экономических информационных систем[Текст] : учебник. – 4 изд. – М.: Финансы и статистика, 1999. – 240 с.

11. Исаев, Г. Н. Информационные системы в экономике [Текст] : учебное пособие для вузов / Г. Н. Исаев. - М. : Омега-Л, 2006. - 462 с. : ил. - (Высшее экономическое образование)

12. Попов Э.В. Статические и динамические экспертные системы [Текст] : Э.В.Попов, И.Б.Фоминых, Е.Б.Кисель, М.Д.Шапот, учебное пособие, -М.: Финансы и статистика, 1996.

13. Якубайтис Э.Я. Информационные сети и системы [Текст]: справочная книга. М.: Финансы и статистика, 1996.

Наши рекомендации