Глава 13. методы представления знаний
Знания и их свойства
Выше уже частично рассматривались такие понятия, как «знания» и «системы, основанные на знаниях», и отмечалась их особая значимость в теории ИИ. Сделаем еще одно весьма важное замечание: в настоящее время в области разработки СИИ сложилась следующая аксиома: никакой самый сложный и изощренный алгоритм извлечения информации (так называемый механизм логического вывода) из интеллектуальной системы не может компенсировать «информационную бедность» ее базы знаний.
Несмотря на широкое распространение и использование понятия «знания» в различных научных дисциплинах и на практике, строгого определения данного термина нет.
Довольно часто используют так называемый прагматический подход: говорят, что знания — это формализованная информация, на которую ссылаются и/или которую используют в процессе логического вывода. Однако такое определение ограниченно: оно фиксирует сознание на уже существующих методах представления знаниях и соответственно механизмах вывода, не давая возможности представить себе другие (новые).
Возможен и другой подход: попытаться на основе определения уже рассмотренного понятия «данные» (см. гл. 12) выявить их свойства и особенности, сформировать дополнительные требования к ним и уже затем перейти к понятию «знания».
Напомним, что данными называют формализованную информацию, пригодную для последующей обработки, хранения и передачи средствами автоматизации профессиональной деятельности.
Какие же свойства «превращают» данные в знания? Перечислим и кратко охарактеризуем шесть основных свойств знаний (часть из них присуща и данным).
Таблица 13.1
Внутренняя интерпретация
1. Внутренняя интерпретация (интерпретируемость). Это свойство предполагает, что в ЭВМ хранятся не только собственно (сами) данные, но и данные о данных, что позволяет содержательно их интерпретировать (табл. 13.1). Имея такую информацию, можно ответить на вопросы типа «Где находится НПО «Энергия»?» или «Какие предприятия выпускают космическую технику?». При этом в первой строке находятся данные о данных (метаданные), а в остальных — сами данные.
2. Внутренняя структура связей. Предполагается, что в качестве информационных единиц используются не отдельные данные, а их упорядоченные определенными отношениями (родовидовыми, причинно-следственными и др.) структуры (эти отношения называют классифицирующими).
Пример: факультет — курс — учебная группа—студент.
3. Внешняя структура связей. Внутренняя структура связей позволяет описывать отдельный объект (понятие). Однако объекты (понятия) способны находиться и в других отношениях (вступать в ситуативную связь).
Пример: объекты «курс Государственного университета управления им. С. Орджоникидзе» и «урожай овощей в совхозе «Зареченский» могут находиться в ситуативной связи «принимает участие в уборке».
4. Шкалирование. Предполагает введение соотношений между различными информационными единицами (т.е. их измерение в какой-либо шкале — порядковой, классификационной, метрической и т.п.) и упорядочение информационных единиц путем измерения интенсивности отношений и свойств.
Пример: «97/ЭИ.6-01 учебная группа занимает первое место на курсе по успеваемости».
5. Семантическая метрика. Шкалирование позволяет соотнести информационные единицы, но прежде всего для понятий, имеющих «количественное» толкование (характеристики). На практике довольно часто встречаются понятия, к которым неприменимы количественные шкалы, но существует потребность в установлении их близости (например, понятия «искусственный интеллект» и «искусственный разум»). Семантики классифицируются следующим образом:
· значение, т. е. объективное содержание;
· контекстуальный смысл, определяемый связями данного понятия с другими, соседствующими в данной ситуации;
· личностный смысл, т.е. объективный значение, отраженное через систему взглядов эксперта;
· прагматический смысл, определяемый текущим знанием о конкретной ситуации (например, фраза «информация получена» может иметь как негативную, так и позитивную оценку — в зависимости от того, нужно это было или нет) [22].
6. Активность. Данное свойство принципиально отличает понятие «знание» от понятия «данные». Например, знания человека, как правило, активны, поскольку ему свойственна познавательная активность (обнаружение противоречий в знаниях становится побудительной причиной их преодоления и появления новых знаний, стимулом активности является неполнота знаний, выражается в необходимости их пополнения). В отличие от данных знания позволяют выводить (получать) новые знания. Будучи активными, знания позволяют человеку решать не только типовые, но и принципиально новые, нетрадиционные задачи.
Кроме перечисленных, знаниям присущи такие свойства, как омонимия (слово «коса» может иметь три смысла, связанных с определениями: девичья; песчаная; острая) и синонимия (знания «преподаватель читает лекцию» и «студенты слушают лекцию» во многих случаях являются синонимами) и др.
Классифицировать знания можно по самым различным основаниям.
По способу существования различают факты (хорошо известные обстоятельства) и эвристики (знания из опыта экспертов).
По способу использования в экспертных системах — фактические знания (факты) — знания типа «А — это А»; правила — знания для принятия решений («Если —то»); метазнания (знания о знаниях — указывают системе способы использования знаний и определяют их свойства). Классическими примерами метазнаний являются народные пословицы и поговорки, каждая из которых характеризует знания (рекомендации по деятельности) в широком классе конкретных ситуаций (например, пословица «Семь раз отмерь, один — отрежь» применима не только в среде хирургов или портных).
По формам представления знания делят на декларативные (факты в виде наборов структурированных данных) и процедуральные (алгоритмы в виде процедур обработки фактов).
По способу приобретения знания делятся на научные (полученные в ходе систематического обучения и/или изучения) и житейские, бытовые (полученные в «ходе жизни»).
Дадим еще ряд определений, часто встречающихся в литературе [21].
Интенсиональные знания — знания, характеризующие или относящиеся к некоторому классу объектов.
Экстенсиональные знания — знания, относящиеся к конкретному объекту из какого-либо класса (факты, сведения, утверждения и т.д.).
Заметим: отношения интенсиональных и экстенсиональных знаний — это родовидовые отношения. Например, понятие «технологическая операция» — это интенсивная, а понятие «пайка» — это экстенсионал, так как пайка — одна из технологических операций. Очевидно, что эти понятия относительны. Так, понятие «пайка», в свою очередь, можно считать интенсионалом по отношению к понятиям «пайка серебром» и «пайка оловом». Как правило, такого рода знания относятся к декларативным.
Физические знания — знания о реальном мире.
Ментальные знания — знания об отношениях объектов.
Мир задачи — совокупность знаний, используемых в задаче.
Мир пользователя — совокупность знаний пользователя.
Мир программы — совокупность знаний, используемых в программе.
Морфологические и синтаксические знания — знания о правилах построения структуры описываемого явления или объекта (например, правила написания букв, слов, предложений и др.).
Семантические знания — знания о смысле и значении описываемых явлений и объектов.
Прагматические знания — знания о практическом смысле описываемых объектов и явлений в конкретной ситуации (например, редкая монета для нумизмата и филателиста имеет различную прагматическую ценность).
Предметные знания — знания о предметной области, объектах из этой области, их отношениях, действиях над ними и др.