Основні підходи до використання знань
ЛК.18 – Побудова бази знань
Анотація
Основні підходи до використання знань. Основні моделі представлення знань. Взаємодія між базою знань та експертною системою. Застосування бази знань та її особливості. Етапи побудови бази знань.
Основні підходи до використання знань
База знань - це сукупність знань, описаних з використанням обраної форми їх подання. База знань є основою будь-якої інтелектуальної системи. База знань містить опис абстрактних сутностей: об'єктів, відносин, процесів.
Історично першими використовувалися процедурні знання, тобто знання, представлені в алгоритмах. Алгоритми, в свою чергу, були реалізовані в програмах. Однак розвиток систем штучного інтелекту підвищило пріоритет декларативних знань, тобто знань, зосереджених в структурах даних.
Однією з найбільш важливих проблем розробки систем штучного інтелекту є представлення знань.
Подання знань - це їх формалізація та структурування, за допомогою яких відображаються характерні ознаки знань: внутрішня інтерпретованість, структурованість, зв'язність, семантична метрика і активність.
При роботі зі знаннями використовуються два основних підходи:
- логічний (формальний) підхід;
- евристичний (когнітивний) підхід.
Логічний (формальний) підхід, при якому основна увага приділяється вивченню та застосуванню теоретичних методів подання знань, формалізації, а також логічної повноти.
Евристичний (когнітивний) підхід, який орієнтується на забезпечення можливостей вирішення завдань. При цьому опора робиться на принцип організації людської пам'яті і евристичне моделювання. На відміну від формальних, евристичні моделі мають різноманітний набір засобів, що передають специфічні особливості тієї чи іншої області.
18.2 Оркестровка процесів
Існують наступні основні моделі подання знань:
- логічні моделі;
- продукційні моделі;
- семантичні мережі;
- фреймові моделі;
- моделі, засновані на нечітких множинах.
Згідно логічного підходу, вся система знань, необхідна для вирішення прикладних задач, розглядається як сукупність тверджень.
Система знань представляється сукупністю формул логіки предикатів. Ця логіка оперує простими висловлюваннями, розчленованими на суб'єкт (щось лежаче в основі) і предикат (щось схвалювану про суб'єкта). Предикат відображає наявність або відсутність у суб'єкта тієї чи іншої ознаки.
Формули в базі знань неподільні. Модифікація бази припускає лише додавання і видалення формул. Логічні методи забезпечують розвинений апарат виведення нових фактів на основі тих, що представлені в базі знань.
Основний недолік логічних методів - відсутність чітких принципів організації фактів в базі знань.
Без формулювання таких принципів модель може перетворитися в погано осяжний конгломерат незалежних фактів, не піддаються аналізу і обробці. Тому логічні методи використовуються переважно в тих предметних областях, де система знань невелика за обсягом і відносно проста за структурою.
В основі логічних моделей лежить формальна система, що задається четвіркою виду: М = <Т, Р, Л, В>.
Безліч Т є безліч базових елементів різної природи, що входять до складу деякого набору. Важливо, що для безлічі Т існує деякий спосіб визначення належності або неналежності довільного елемента до цього безлічі.
Безліч Р є безліч синтаксичних правил. З їх допомогою з елементів Т утворюють синтаксично правильні сукупності. У безлічі синтаксично правильних сукупностей виділяється підмножина А. Елементи А називаються аксіомами.
Безліч У є безліч правил виводу. Застосовуючи їх до елементів Л, можна отримати нові синтаксично правильні сукупності, до яких знову можна застосовувати правила з В.
Правила виведення є найбільш складною складовою формальної системи. У базі знань зберігаються лише ті знання, які утворюють безліч А, а всі інші знання виходять з них за правилами виводу.
Психологічні дослідження процесів прийняття рішень показали, що, розмірковуючи і приймаючи рішення, людина використовує продукційні правила (від англ. Production - правило виводу). У загальному випадку продукційне правило можна представити в наступному вигляді:
i: S; L; AàB; Q,
де i - індивідуальний номер продукції; S - опис класу ситуацій, в якому дана структура може використовуватися; L - умова, при якому продукція активізується; А-> В - ядро продукції, наприклад: «ЯКЩО A1, А2 ..., Аn ТО В».
Такий запис означає, що «якщо всі умови від А1, до Ап є істиною, то В також істина»; (Q-постусловіем продукційного правила, описує операції і дії (процедури), які необхідно виконати після виконання В.
У лівій частині правила продукції ставиться деякий умова, а в правій частині - дія. Якщо всі умови істинні, то виконується дія, задане в правій частині продукції.
При використанні продукційної моделі база знань складається з набору правил. Програма, що управляє перебором правил, називається машиною виводу. Механізм виведення пов'язує знання воєдино, а потім виводить з послідовності знань висновок.
Властивості продукційних моделей:
- модульність - окремі продукційні правила можуть бути додані, видалені або змінені в базі знань незалежно від інших;
- кожне продукційне правило є самостійним елементом знань;
- простота смислової інтерпретації;
- природність з точки зору здорового глузду.
Недоліки продукційних систем виявляються тоді, коли число правил стає великим і виникають непередбачувані побічні ефекти від зміни старого і додавання нового правила. Крім того, скрутна оцінка цілісного образу знань, що містяться в системі.
Семантична мережа - це модель формалізації знань у вигляді орієнтованого графа з розміченими вершинами і дугами. Вершин відповідають об'єкти, поняття або ситуації, а дугам - відношення між ними.
В якості понять зазвичай виступають абстрактні або конкретні об'єкти, а відносини - це зв'язки типу: «це» («АКО - А-Кind-Of», «is») «має частиною» («has part») «належить». Характерною особливістю семантичних мереж є обов'язкова наявність трьох типів відносин:
- клас-елемент класу;
- властивість-значення;
- приклад елемента класу.
Найбільш часто в семантичних мережах використовуються наступні відносини:
- Зв'язки типу «частина-ціле»;
- Функціональні зв'язки (які визначаються зазвичай дієсловами «виробляє», «впливає» та ін);
- Кількісні (більше, менше, однаково і т. д.);
- Просторові (далеко від, близько від і ін);
- Тимчасові (раніше, пізніше і ін);
- Атрибутивні зв'язки (мати властивість, мати значення);
- Логічні зв'язки (І, АБО, НЕ);
- Лінгвістичні зв'язки та ін.
Термін фрейм (frame - каркас, рамка) запропонований М. Мінським у 70-ті роки для позначення структури знань по сприйняттю просторових сцен. Ця модель, як і семантична мережа, має глибоке психологічне обгрунтування. Під фреймом розуміється абстрактний образ або ситуація.
Фреймова модель, заснована на теорії М. Мінського, являє собою систематизовану у вигляді єдиної теорії технологічну модель пам'яті людини та її свідомості.
Всі фрейми взаємозв'язані і утворюють єдину фреймову структуру, в якій органічно поєднані декларативні та процедурні знання. Це дає можливість досить швидко виробляти композицію і декомпозицію інформаційних структур аналогічно тому, як це робив би людина при описі структури своїх знань.
Найважливішою властивістю фреймів є запозичене з теорії семантичних мереж спадкування властивостей. І у фреймах, і в семантичних мережах спадкування відбувається по зв'язках типу «це» (АКО - А-Кind-оf) - Слот АКО вказує на фрейм більш високого рівня ієрархії, звідки неявно успадковуються, тобто переносяться, значення аналогічних слотів, причому спадкування властивостей може бути частковим.
До основних переваг фреймової моделі відносяться:
- здатність відбивати концептуальну основу організації пам'яті людини;
- наочність представлення;
- модульність;
- можливість використання значень слотів за замовчуванням.
Однак фрейм-уявлення є не конкретним мовою подання знань, а деякою ідеологічною концепцією, яка реалізується по-різному в різних мовах. Теорія фреймів послужила поштовхом до розробки декількох мов представлення знань, які завдяки своїм широким можливостям і гнучкості стали в останні роки досить поширеними.
Основним недоліком фреймових моделей є відсутність механізмів управління виводу.
Існує цілий клас описів, що оперують якісними характеристиками об'єктів (багато, мало, сильний, дуже сильний і т. п.). Ці характеристики зазвичай розмиті і не можуть бути однозначно інтерпретовані, проте містять важливу інформацію.ьУ завданнях, розв'язуваних інтелектуальними системами, часто доводиться користуватися неточними знаннями, які не завжди можуть мати чіткі значення істинності.
На початку 70-х американський математик Лотфі Заде запропонував формальний апарат нечіткої (fuzzy) алгебри і нечіткої логіки. Пізніше цей напрям одержало широке поширення і поклало початок однієї з гілок штучного інтелекту під назвою м'які обчислення. Л. Заде ввів одне з головних понять в нечіткої логіки - поняття лінгвістичної змінної.
Лінгвістична змінна (ЛП) - це змінна, значення якої визначається набором словесних характеристик деякого властивості.
Нечітка множина визначається через деяку базову шкалу В і функцію приналежності нечіткій множині m (х), x є В, приймаючу значення на інтервалі [0 ... 1]. Таким чином, нечітка множина В - це сукупність пар виду (х, m (х), де), x є В.
Функція приналежності визначає суб'єктивну ступінь впевненості експерта в тому, що дане конкретне значення базової шкали відповідає обумовленому нечіткій множині.