Основні властивості знань. їх відмінність від даних

Знання, як і дані, несуть певну інформацію, але дані не можуть проводити логічне виведення. Щоб знання мали здатність відтворювати якоюсь мірою знання людини і моделювати процес її міркування, вони повинні мати певні властивості. Існує, як мінімум, 6 таких обов’язкових властивостей знань. Саме ці властивості вказують на відмінність знань від даних:

1) внутрішня інтерпретованість знань;

2) внутрішня структура зв’язків (структурованість);

3) наявність ситуативних зв’язків (зовнішня структура зв’язків);

4) шкалювання;

5) занурення в простір із семантичною метрикою;

6) наявність активності.

Всі такі властивості надають можливість якомога повніше відобразити не тільки об’єкти ПрО, але й різноманітні зв’язки та відношення між об’єктами. Розглянемо властивості знань.

Внутрішня інтерпретованість знань

При обробці даних в комп’ютері всі дані машина інтерпретує як двійкові числа, над якими виконуються певні операції. Причому дізнатися, що саме стоїть за кодом, машина не може. Інтерпретація даних залишається в голові у програміста. Іншими словами, комп’ютер не знає, що саме він робить, тому перший крок на шляху до знань в тому і полягає, щоб надати комп’ютеру ці відомості, тобто дати можливість йому інтерпретувати як самі дані, так і дії над ними, тобто інтерпретувати смисловий зміст даних.

Нехай комп’ютер розв’язує задачу обліку наявності деталей на складі декого автогосподарства. В пам’яті машини зберігається табличка наступного вигляду:

Найменування одиниці	Номер секції	Кількість	Модель
Картер			ВАЗ 2106
Кришка від картера			ВАЗ 2109
Кришка від картера			ВАЗ 21099
Розподільчий вал			ВАЗ 2101
Лобове скло			ВАЗ 2104

Припустимо, що спочатку в пам’ять комп’ютера введена частина таблиці, яка є заповнена. Її дані якимось чином розташовані в пам’яті машини. Тоді їх використання є можливим тільки в той спосіб, який передбачений програмістом в його програмі, тому тільки програми зможуть знайти потрібні дані і провести над ним необхідні операції. Якщо ввести в пам’ять всю таблицю, де в її “шапці” перелічені всі 4 атрибути, то кожен атрибут є ім’ям відповідного стовпця таблички. Друга частина такої таблиці складається з рядків, кожен з яких містить 4 елементи. Кожен рядок можна розглядати як відношення між цими елементами. Отже, перший рядок з ім’ям Картер можна описати так:

Картер (<Номер секції, 54>, <Кількість, 200>, <Модель, ВАЗ 2106> )

Круглі дужки виділяють зміст інформаційної одиниці, а кутові дужки – це окремі самостійні одиниці, які називають слотами.

В найзагальнішому вигляді повний запис будь-якої таблиці, представленої як сукупність слотів, буде мати наступний вигляд:

Ім’я інформаційної одиниці (<ім’я першого слоту, значення першого слоту>, <ім’я другого слоту, значення другого слоту>, ... , <ім’я m-го слоту, значення m‑го слоту>)

В пам’яті машини вся така таблиця зберігається як окрема інформаційна одиниця у вигляді деякого файлу, а БД структурована таким чином, що хоча ще не є БЗ, проте може відповісти на деякі запитання: скільки деталей зберігається в секції 54? Перелічити всі деталі (запчастини), які зберігаються на складі. Чи зберігається на складі розподільчий вал? Для відповіді на такі запитання повинна функціонувати система спілкування, яка має виділяти такі словосполучення, як скільки деталей зберігається, перерахувати всі запчастини та ін. Саме такі словосполучення визначають тип процедур, які необхідно використати при роботі зі збережуваною інформацією. Такий спосіб широко відомий в сучасних БД. Його називають реляційною моделлю подання даних,а БД, які реалізовані у вигляді реляційних таблиць, – реляційними БД.

1. Внутрішня структура зв’язків (структурованість)

Людина має властивість пізнання світу через виділенні в об’єкті, що пізнається, окремих елементів і зв’язків між ними. Це дозволяє їй сприймати об’єкт як деяку структуру, представляти складні об’єкти у вигляді сукупності більш простих, а також пізнавати властивості нового об’єкту через властивості тих об’єктів, що входять до його структури. Така властивість структурованості об’єктів реального світу відображається в тому, що відповідні поняття зв’язуються між собою зв’язками типу частина‑ціле, клас‑елемент, рід‑вид. Такі зв’язки між поняттями утворюють в нашій пам’яті деякі ієрархії понять і дозволяють вводити нові поняття, так виникають поняття “студенти”, “ссавці”.

Знання, які необхідно представляти в машині, також повинні володіти спроможністю до утворення різних ієрархій, введенням нових понять, а також декомпозицією понять на складові частини, через які утворюються ці поняття і відношення між ними. Такі зв’язки між різними частинами понять можна представити різними способами: один з них – це явне задання різноманітних одиниць інформації і зв’язків між ними, які задають, наприклад, родо‑видові відношення.

При цьому є можливість одноразового запису кожного елементу інформації. При необхідності отримання на даному рівні деталізації всієї інформації необхідно переходити від неї вверх до найостаннішої у цій ієрархії родової одиниці, якої бракує системі.

Якщо кожна інформаційна одиниця описується у вигляді слоту, то в даному випадку слоти будуть вкладатися один в інший і отриману структуру називають фреймом (frame)/ В даному прикладі “МЕБЛІ” – ім’я фрейму, “СТІЛЬЦІ” – ім’я першого слоту, “СТОЛИ” – 2‑го, “ШАФИ” – 3‑го і т.д. Причому перший слот містить у своєму складі 2 слоти більш низького рівня і аналогічно 3‑й слот.

Між слотами різних рівнів можуть існувати найрізноманітніші відношення. Зауважимо, що вкладеними можуть бути не тільки слоти, але й фрейми. Вкладати можна також команди і навіть цілі програми. Отже, фрейм – це багаторівнева структура з ієрархічним вкладенням слотів, причому слоти можуть задавати не тільки поняття, але й дії – це все надає фреймам гнучкості і багатозв’язності.

2. Наявність ситуативних зв’язків (зовнішня структура зв’язків)

При роботі з фреймами можуть виникати такі ситуації, коли окремі факти і явища, що входять до структури одного фрейму, вступають в певних ситуаціях в ситуативний зв’язок з фактами і явищами з інших фреймів. Для відображення таких ситуативних зв’язків використовуються спеціальні окремі слоти. В них вказують ім’я фреймів, з якими існує ситуативний зв’язок, а також імена відношень, які здійснюють ці зв’язки.

основні властивості знань. їх відмінність від даних - student2.ru

В результаті виникає “мережа”, яка у вершинах містить імена фреймів, а дуги описують відношення між фреймами, причому ці дуги є іменованими. Таку мережу називають семантичною. За допомогою семантичних мереж можна відображати закономірності щодо фактів, процесів, явищ, причинно-наслідкових відношень між ними. Прикладом семантичної мережі може бути мережа, побудована для задачі з мавпою і бананами.

3. Шкалювання

Розумова діяльність людини спирається на бажання впорядкувати ті об’єкти і процеси, з якими людина має справу в реальному житті. Це бажання розсортувати події, явища, факти, з якими ми маємо справу. Для цього використовують різну шкали. В житті ми використовуємо 2 види шкал – строгі (метричні) та розмиті. Метричні – це шкали впорядкування людей за віком, військовими званнями, ваговими категоріями. У випадку розмитих шкал оцінюються деякі явища за допомогою слів природної мови з неоднозначністю. Частоту появи деякої події можна оцінити таким чином: ніколи; надзвичайно рідко; дуже рідко; рідко; рідко, але не дуже; не часто, але й не рідко; часто, але не занадто; часто; дуже часто; майже завжди; завжди. Серед розмитих шкал існують опозиційні шкали з протилежними значеннями: гострий-тупий, сильний-слабкий. Відображуючи відношення і зв’язки реального світу, БЗ повинна відобразити цю властивість міркування людей, шкалювання своїх знань.

4. Занурення в простір із семантичної метрикою

У нашій уяві простір, в якому ми існуємо, утворюється тими чи іншими поняттями, фактами, явищами, які можуть бути близькими за своїм змістом, тобто семантикою, наприклад, поняття “вчитель”. В який простір ми маємо помістити це поняття? Це може бути “інтелігенція”, ”робітники розумової праці”, “освічені люди” або “службовці”. В залежності від контексту, в якому розглядається поняття, воно може потрапляти в той чи інший простір об’єктів, близьких за семантикою, – кластерів. Попадання об’єкта в той чи інший кластер залежить від конкретної, типової ситуації. Типова ситуація вважається ядром, біля якого групується інформація. Розглянутий принцип – це один з принципів утворення кластерів. Існує й інший принцип – за частотою появи. Наприклад, на прохання назвати ім’я поета найчастішою буде відповідь “Шевченко”, “Пушкін”, “Байрон”. Таким чином, існує щонайменше 2 системи оцінки близькості інформаційних одиниць. Перша система спирається на ситуативну близькість, а друга – на частоту появи певних понять в типових ситуаціях.

В теорії знань розроблена строга теорія утворення ситуаційних кластерів, що дозволяє значно підвищити рівень інтелекту створюваної системи обробки знань.

5. Наявність активності знань

При роботі традиційної ЕОМ за заданою програмою обробляються ті чи інші дані, тобто програма містить процедурні знання. Вона зберігає інформацію про те, як саме потрібно діяти, щоби отримати результат. В той же час дані представляють собою декларативні знання. Вони зберігають інформацію про те, над чим потрібно виконати ці дії.

Таким чином, програма відіграє роль активізатора знань. Зовсім інакше у людини. Дуже часто в процесі мислення саме декларативні знання є таким активізатором процедур. Реалізувати таку можливість в БЗ в чистому вигляді поки що не вдалося. Частково це задовольняється за допомогою змішаного представлення декларативних і процедурних знань. В такому представленні ці 2 види знань можуть активізувати один одного.

Як приклад розглянемо деякий фрейм, що містить кілька слотів. Припустимо, що в якості одного зі слотів виступає ім’я деякої процедури, а звертання до слоту визначається множиною різноманітних відношень між слотами цього або інших фреймів. Отже, система таких відношень формує умови, необхідні для виконання цієї процедури і у фреймах з процедурними слотами декларативні знання стають активізаторами процедур. Таким чином, можливість активізації процедур, дій операцій за допомогою даних – це найважливіша особливість БЗ. По суті це означає відхід від фундаментального принципу роботи класичної ЕОМ фон-нейманівського, тобто роботи за жорстко заданим алгоритмом. В СШІ такого принципу немає.

Крім перерахованих принципових відмінностей знань від даних, існують і інші особливості. Наприклад, знання відрізняються від даних формою подання: дані відбивають кількісні характеристики і подаються у цифрах, а знання представляють якісні характеристики і подаються текстом). Іншою особливістю є те, що дані отримують семантичну інтерпретацію тільки після їх розробки відповідними програмами, а знання завжди несуть у собі смисловий зміст.

На виході системи штучного інтелекту користувач отримує не машино- чи відеограму (таблицю), а деяку інтелектуальну пораду, вибраний варіант рішень та інші результати моделювання розумовою діяльності людини.

Напрямки сучасної комп’ютерної технології обробки знань

основні властивості знань. їх відмінність від даних - student2.ru

Проблеми обробки знань в системах штучного інтелекту надзвичайно різноманітні і стосуються як представлення знань, так і їх безпосередньо обробки. Важливими проблемами також є організація знань з метою їх ефективного використання користувачем. Усі ці напрямки можна подати наступною схемою: ММЗ – це мова маніпулювання знаннями

В якості джерел знань виступають експерти (кваліфіковані спеціалісти в ПрО), спеціальна література по відповідних проблемах, особистий досвід користувачів. Як правило, знання погано формалізовані і слабо структуровані, тому що саме за цих умов людина і звертається до СШІ. Тому основним джерелом знань є експерти. Знання, які можуть бути отримані від них, – це набір спеціальних фактів, правил, процедур, оцінок в деякій вузькій області знань, а не загальні знання в деякій ПрО. В процесі передачі знань від експерта в систему бере участь когнітолог (інженер по знаннях). Цей процес достатньо складний, оскільки форма подання знань, які формулює експерт, не співпадає зі способами представлення знань в системі. Крім того, іноді експерт не знає, як передати свої знання, а іноді й не бажає цього робити.

Процес отримання знань від експерта і формування на їх основі структуризованої формалізованої моделі ПрО можна розбити на декілька етапів:

1) ідентифікація знань;

2) концептуалізація знань;

3) формалізація;

4) реалізація системи знань

5) тестування системи знань.

1) На етапі ідентифікації експерт і когнітолог повинні дати певну характеристику задач, які розв'язуються, і знань, пов'язаних з цими задачами. Вони повинні відповісти на запитання типу: які класи задач буде вирішувати дана система?

Які задачі основні, а які допоміжні (підзадачі)? Який список цих підзадач? Які основні поняття необхідні для оперування в системі? Які взаємозв'язки між різноманітними поняттями?

2) На етапі концептуалізації всі поняття і зв'язки між ними, що були виявлені на попередньому етапі, повинні бути явним чином зафіксовані з використанням деякої природньої мови.

3) Формалізація – це формальне представлення зафіксованих основних понять та їх зв'язків на деякій внутрішній мові представлення знань. Це може бути або формальна модель знань, яка базується на численні висловлювань і численні предикатів, або неформальна (продукційна система, семантичні мережі, фрейми).

4) Після формалізації, результатом якої є деякий варіант БЗ, реалізація БЗ відбувається у вигляді текстів і програм СУБЗ і ММЗ. На цьому етапі діаграми, графіки, тексти, що стосуються моделі ПрО, а також правила логічного виведення представляються засобами СУБЗ і ММЗ.

5) Етап тестування передбачає перевірку і відлагоджування в рамках побудованої експериментальної СШІ. Для цього використовуються текстові приклади з деякої ПрО. Цей процес має ітеративний характер, оскільки в БЗ вносять необхідні зміни в процесі тестування і можливі зміни у всіх попередніх станах.

Семантичні мережі як моделі представлення знань

Сама назва “семантична мережа” акцентує увагу на смислі, оскільки семантика – це змістовна сторона мови. Слово “семантичний” означає “зв’язаний” із смислом. Отже, в с.с. головним є значення тих слів, речень ситуацій, які входять в модель ПрО і які необхідно описати адекватно в нашому уявленні. Причому такий опис має бути здійсненим на такому рівні, щоб із смислом слів, речень, ситуацій можна було б працювати, тобто моделювати процеси, міркування, виведення, порівняння, співставлення і т.д. Звичайно, це не є простою проблемою, але усе ж таки, в деякій мірі, це можна реалізувати багатьма способами. Рішення цієї проблеми і на перетині різних цікавих дисциплін, включаючи лінгвістику, психологію і т.д. Надалі під семантикою будемо розуміти відношення між деякими об'єктами, які можуть бути описані за допомогою символів, слів, речень, піктограм, образів, тобто всього того, що є необхідним для опису об'єктів, процесів, станів ПрО. Семантичні меежі являються зручними для графічного опису об’єктів ПрО.

Семантичні мережі – це напрямлений граф з мітками на вершинах або ребрах (дугах). При цьому вершини ототожнюються з відповідними об’єктами ПрО, а дуги – з відношенням між об’єктами.

основні властивості знань. їх відмінність від даних - student2.ru

Рис. 1.

Отже, інформаційні одиниці подаються пойменованими вершинами, а відношення – пойменованими направленими дугами. Подана семантична мережа відповідає відношенню, яке має схему ОСОБА (ПРІЗВИЩЕ, РІК НАРОДЖЕННЯ, СТАТЬ)

Подвійними стрілками подане відношення “є видом”, а потрійними стрілками – “є представником”.

Поняття “особа”, “чоловік”, “жінка”, “рік” є загальними поняттями, а інші вершини відображують факти, тобто конкретні дані про ПрО. Існує багато різних видів семантичних мереж. Вони формуються в залежності від трьох факторів:

1) Чи є вершини мережі простими або складними;

2) Скільки відношень і які саме відношення використовують в семантичних мережах?

3) Які процеси необхідно моделювати на семантичних мережах ?

Вершина семантичної мережі називається простою (ординарною), якщо вона не має внутрішньої структури. Іншими словами, прості вершини ототожнюються з кінцевими об’єктами того середовища, що моделюється. В якості простих вершин можуть фігурувати числа, слова, піктограми тощо.

Складна вершина – це вершина, яка допускає розкриття, може йти до семантичної мережі, в якій приймають участь тільки прості вершини.

Отже, семантичні мережі із складними вершинами може розгортатися, як “матрёшка”. Щодо другого фактору, відзначимо, що відношення є дуже різноманітними за типом і властивостями. Наведемо основні типи відношень, які використовуються в системах ШІ:

1. Лінгвістичні відношення – це, по-перше, відмінкові відношення (хто, кого, чого), або рольові відношення (що, де, коли, для чого, чому, місце, час і т.д.)

2. Атрибутивні відношення– форма, розмір, колір, смак та ін.

3. Відношення дії – коли кожне дієслово розглядається, як відношення між об’єктом дії і об’єктом, що виражає деяку здатність (літати, ходити, стояти...), тобто здатність, яка реалізується в часі як процес.

4. Логічні відношення ( основні властивості знань. їх відмінність від даних - student2.ru .

5. Квантифіковані відношення ( основні властивості знань. їх відмінність від даних - student2.ru ).

6. Теоретико-множинні відношення(множина, підмножина, об’єднання, перетин і т.д.)

Найбільш різноманітною є група лінгвістичних відношень. В ній можуть бути виділені підгрупи різних типів відношень, а саме: часові, просторові (над, під...), причинно-наслідкові (каузальні). Така класифікація є важливою, оскільки різні типи відношень володіють різними властивостями, які необхідно враховувати при побудові моделей виведення в с. с. Це такі властивості, як рефлективність, симетричність, транзитивність і їх заперечення: анти рефлективність, анти симетричність, анти транзитивність. Кожне відношення характеризується певним набором цих шести властивостей. В залежності від того, які типи відношень використовуються, можна відмітити декілька видів с. с.:

1) однорідні семантичні мережі. В них використовується тільки один тип відношень (немає значення, який, але тільки один).

2) ієрархічні семантичні мережі. Тут використовуються відношення двох основних типів:

1) „ЦІЛЕ-ЧАСТИНА” („КЛАС-ПІДКЛАС-ЕЛЕМЕНТ”);

2) „ЧАСТИНА-ЦІЛЕ” („ЕЛЕМЕНТ-ПІДКЛАС-КЛАС”).

Відношення першого типу називаються “IS A”.

Відношення другого типу називаються “AKO” - “a kind of”.

Кожне з цих типів відношень утворює свою власну ієрархію, класичним прикладом ієрархічних с. с. є організаційні структури, які будуються за відношенням “IS A”.

Приклад:

основні властивості знань. їх відмінність від даних - student2.ru

3) сценарні семантичні мережі Використовують відношення строгого або нестрогого порядку, а також відношення в часі причинно-наслідкові (каузальні) відношення.

4) функціональнісемантичні мережі. В них використовуються функціональні відношення типу „вхід-вихід”:

основні властивості знань. їх відмінність від даних - student2.ru