Информационное описание ПрО
Лекция N 4
Представление знаний о предметной области
1 Уровень представления знаний о предметной области.
2. Роль понятий и связей в описание предметной области.
3. Логические формулы понятий.
Уровни представления знаний о предметной области
При построении описания выделенного фрагмента реальной действительности одним из основных допущений является предположение о том, что мир состоит из независимых объектов (предметов, вещей или сущностей), которые могут быть уникально идентифицированы. В дальнейшем при обозначении реальных объектов ПрО для однозначности будем использовать термин сущность.
Сущности ПрО необходимо адекватным образом представить в памяти вычислительной машины, чтобы с ее помощью обеспечить поиск, анализ, обработку и выдачу накопленной информации в форме, удобной для принятия решений. Эта задача может быть решена путем использования соответствующих средств описания ПрО, предоставляющих необходимые базовые понятия, инвариантные по отношению к любым ПрО, и правила, позволяющие строить более сложные синтаксические конструкции на основе базовых. Средства представления информации о ПрО различные исследователи называют по-разному. Так, в работах по базам данных [24, 61] их определяют как концептуальные (понятийные), или информационно-логические, а в исследованиях по искусственному интеллекту и экспертным системам [44] — как представление знаний. При этом задача представления ПрО в памяти ЭВМ делится на два взаимосвязанных уровня: уровень концептуального моделирования понятий и уровень модели данных
Уровень концептуального моделирования понятий. Концептуальная модель создается в результате формализации описания ПрО и информационных потребностей пользователей с помощью соответствующих средств представления понятий, а база данных физически моделирует конкретные сущности ПрО, которые охватываются понятиями, введенными в рамках концептуальной модели. Это значит, что база данных моделирует состояния ПрО, а ее концептуальное представление задает статические и динамические ограничения на состояния ПрО, которые могут рассматриваться как некоторые аксиоматические высказывания о предметной области. Таким образом, при данном подходе производится четкое разграничение концептуальной информационной модели предметной области и модели данных. На практике уровень концептуальной модели ПрО часто отсутствует, что может привести к значительным ошибкам при проектировании. Выделение этапа концептуального моделирования ПрО обеспечивает большую гибкость и независимость всего проекта от используемых инструментальных средств. Данные отделены от содержащейся в ней информации (знаний), а обработка данных—от обработки знаний.
Такой подход целесообразен по той причине, что количество сущностей ПрО намного превосходит число понятий, необходимых для описания их семантики, в связи с чем требуются специализированные средства накопления, хранения и ведения большого числа однородно форматированных данных. Концептуальное моделирование обеспечивает высокоуровневые средства спецификации предметной области, используемые для создания проекта системы искусственного интеллекта и ее реализации с помощью специальных инструментальных средств. Для решения данной задачи необходима взаимосвязанная совокупность понятий, механизмов и языковых средств, обеспечивающих формализованное описание проектировщиком предметной области и проекта будущей системы. Этап концептуального моделирования играет в этом процессе решающую роль, так как дает интегрированное представление о предметной области.
Уровень модели представления знаний. Данный уровень обеспечивает необходимые изобразительные средства для представления сущностей ПрО в базе знаний.
Модель представления знаний можно определить как совокупность формальных средств и методов, в соответствии с которыми логически организуются знания в БЗ. Модель представления знаний задает, процедурную интерпретацию (процедурную семантику), базирующуюся на операциях модификации БЗ: ввод, обновление, удаление [84]. Модель данных определяет синтаксическую и семантическую основу для проектирования и эксплуатации БЗ.
Понятие является основной категорией, используемой для описания ПрО при концептуальном моделировании. Концептуальная модель ПрО в первую очередь опирается на декларативную семантику, что позволяет проектировщику полностью сосредоточиться на решаемой проблеме и на способах ее разбиения (декомпозиции) на более мелкие подзадачи. При этом выделяют следующие уровни представления знаний о ПрО: информационное описание ПрО; функциональное описание ПрО; понятийное описание ПрО.
Информационное описание ПрО
Основные категории составляют элементы данных (ЭД) и документы. Под ЭД понимается наименьшая единица поименованных данных, имеющая смысл при описании информации [42]. Собираемая в процессе обследования ПрО информация обычно включает наименование ЭД, его смысловое содержание и характеристики значений. Под документом [42] понимается группа взаимосвязанных ЭД, рассматриваемая пользователем как единое целое. Различают собственно документ и его макет. Документы бывают регламентированные (имеется общепринятый макет документа) и нерегламентированные. Примером нерегламентированных документов является телефонограмма, письмо и другие неформализованные сообщения.