Инженерия знаний и получение знаний
Инженерия знаний
После проектирования базы знаний и разработки соответствующего программного обеспечения либо выбора удовлетворяющего требования готового решения необходимо сформировать базу знаний, наполнив ее знаниями о предметной области, и возможно необходимыми фактами. Этап формирования базы знаний интеллектуальной системы является критическим для функционирования всей системы в целом, так как если реализация влияет на возможные границы способностей системы, то знания системы определяют ее возможности в решении задач предметной области.
Этот этап разработки ИИС называют этапом приобретения знаний. Область деятельности, изучающая проблемы формирования и наполнения баз знаний, получила название инженерия знаний.
Инженерия знания - достаточно молодое направление искусственного интеллекта, появившееся тогда, когда практические разработчики столкнулись с весьма нетривиальными проблемами трудности «добычи» и формализации знаний. В первых книгах по ИИ эти факты обычно только постулировались, в дальнейшем начались серьезные исследования по выявлению оптимальных стратегий выявления знаний . Исследования привели к возникновению дисциплины инженерии знаний, и появлению новой специальности - инженера по знаниям, или специалиста, владеющего теоретическими знаниями и практическими приемами построения интеллектуальных систем, а главное, обученного способам формирования баз знаний интеллектуальных систем.
Предметные знания интеллектуальной системы могут быть взяты из многих источников, ноо главный источник знаний современных ИИС - это специалист-эксперт в предметной области. Инженер знаний обычно получает знания, непосредственно взаимодействуя с экспертом. Этот процесс состоит из продолжительной серии напряженных, систематических интервью, обычно продолжающихся в течение многих месяцев. Во время бесед инженер знаний дает эксперту для решения задачи, близкие к реальным и того же типа, на решение которых ориентируется создаваемая экспертная система. Инженер знаний должен работать с экспертом, наблюдая, как он решает конкретные задачи. Редко оказывается эффективным подход, при котором эксперту напрямую задаются вопросы о его правилах или методах решения конкретного класса задач в его области компетентности. Эксперты обычно испытывают большие трудности при формулировании таких правил.
Представляется, что «эксперты» имеют тенденцию формулировать свои заключения и то, как они пришли к ним, в общих выражениях, которые слишком широки и расплывчаты для эффективного анализа на ЭВМ. Предпочтительнее, чтобы ЭВМ работала на более конкретном уровне, имея дело с четко определенными порциями исходной информации, которые могут быть встроены в более сложные суждения. Но эксперт редко работает на таком конкретном уровне. Он быстро делает сложные выводы, не утруждая себя тщательным анализом и формулированием каждого шага своего процесса рассуждения. Порции исходных знаний являются неявными допущениями, и они компонуются друг с другом так быстро, что эксперту трудно описать этот процесс. Когда он анализирует проблему, он не может легко описать каждый шаг и он может даже не иметь представления о тех отдельных шагах, которые были сделаны для нахождения решения. Он может приписать интуиции или назвать предчувствием то, что оказывается результатом очень сложного логического процесса, основанного на огромном количестве удерживаемых в его памяти данных и богатой практике. В последующем, объясняя свое заключение или предчувствие, он будет повторять только основные шаги, часто опуская большинство мелких шагов, которые могли показаться ему очевидными в то время. Знание о том, что считать основным и относящимся к делу и не требующим дальнейшей переоценки — вот что делает специалиста «экспертом». Этот аспект природы эксперта несколько необычен. На практике он называется парадоксом экспертизы. В контексте разработки интеллектуальных систем мы будем называть его парадоксом инженерии знаний:
Чем более компетентными становятся эксперты, тем менее способны они описать те знания, которые они используют для решения задач!
Хуже того, исследования показали, что когда эксперты пытаются объяснить, как они пришли к заключению, они часто выстраивают правдоподобные линии рассуждения, которые, однако, мало похожи на их действительное поведение при решении задач. Эта особенность имеет два важных следствия. Вот первое из них:
эксперты нуждаются в посторонней помощи, направленной на то, чтобы прояснить и сделать явным их способ мышления и решения задач. Высказанное можно сформулировать в виде следующего эмпирического правила - не будьте своим собственным экспертом!
Второе эвристическое правило, обращенное к инженеру знаний:
Не верьте всему, что говорят эксперты!
Опытные инженеры знаний развивают рабочие гипотезы, основанные на том, что говорят эксперты, и проверяют эти гипотезы на правильность и непротиворечивость, предлагая экспертам решать новые проблемы, требующие предполагаемых (согласно гипотезе) знаний. Инженер знаний считает, что он или она получили законное экспертное правило не потому, что эксперт ручается за точность правила, а потому, что эксперт демонстрирует применение этого правила при решении задачи.
Иногда поведение экспертов выглядит скорее интуитивным, чем рассудочным. Дело в том, что значительный объем знаний является важнейшей предпосылкой мастерства эксперта. Однако знания эксперта — не просто неупорядоченный свод фактов. Большое число образцов-шаблонов ситуаций служат указателями, помогающими эксперту в долю секунды обратиться к нужным частям его запасов знаний. Эта способность использовать шаблоны для управления процессом интерпретации и решения, возможно, и составляет значительную часть того, что мы называем физической интуицией.
Более того, эксперт может применять совершенно разные методы работы и методики в разных нестандартных ситуациях, и сознательно выделить критерии использования различных методик необычайно трудно.
Терминология инженерии знаний
Поле знаний — это условное неформальное описание основных понятий и взаимосвязей между понятиями предметной области, выявленных из системы знаний эксперта, в виде графа, диаграммы, таблицы или текста [1,с.59].
Поле знаний, как первый шаг к формализации, представляет модель знаний о предметной области, в том виде, в каком ее сумел выразить эксперт на некотором «своем» языке. Проблемы адекватного формирования языка для описания предметной области мы в данном курсе рассматривать не будем. Хорошим источником специальной информации по этой теме служит [1].
Поле знаний служит ключевым средством для последующего построения модели предметной области в базе знаний.
Для названия процесса получения знаний (вида выбираемой при этом стратегии) в литературе получило распространение несколько терминов: приобретение, добыча, извлечение, получение, выявление, формирование знаний. В англоязычной специальной литературе в основном используются два: acquisition (приобретение) и elicitation (выявление, извлечение, установление).
Термин «приобретение» трактуется либо очень широко — тогда он включает весь процесс передачи знаний от эксперта к базе знаний ЭС, либо уже как способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура поля знаний заранее закладывается в программу). В обоих случаях термин «приобретение» не касается самого таинства экстрагирования структуры знаний из потока информации о предметной области. Этот процесс описывается понятием «извлечение».
Извлечение знаний (knowledge elicitation) — это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.
Приобретение знаний (knowledge acquisition) — процесс наполнения базы знаний экспертом с использованием специализированных программных средств (прямое взаимодействие ИИС с экспертом).
Термин формирование знаний традиционно закрепился за чрезвычайно перспективной и активно развивающейся областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов обучения. Она включает индуктивные модели формирования знаний и автоматического порождения гипотез на основе обучающих выборок, обучение по аналогии и другие методы. Эти модели позволяют выявить причинно-следственные эмпирические зависимости в базах данных с неполной информацией, содержащих структурированные числовые и символьные объекты (часто в условиях неполноты информации).
Формирование знаний (machine learning) — процесс анализа данных и выявление скрытых закономерностей с использованием специального математического аппарата и программных средств.
Методы получения знаний
Инженерия знаний предлагает определенные методы (приемы, способы),работы с экспертами.
Классификация методов работы с экспертами
Под коммуникативными методами понимают все виды контактов инженера по знаниям с живым источником знаний — экспертом. Среди этих методов выделяют две большие группы: активные и пассивные.
Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний принадлежит эксперту. При этом инженер по знаниям главным образом протоколирует рассуждения и действия эксперта.
В активных методах инициатива полностью в руках инженера по знаниям. Он ведет с экспертом беседу, предлагает различные «Игры», организует «круглый стол» и т. д.
Пассивные методы на первый взгляд просты. Вместе с тем, они требуют от инженера по знаниям умения анализировать «поток сознания» эксперта и выделять в нем ценные фрагменты знания.
Активные методы разделяют на две группы в зависимости от числа экспертов, участвующих в процедуре извлечения знаний - В групповых методах большое значение имеет дискуссия между экспертами, в которой нередко выявляются нетривиальные аспекты знаний. В то же время, ведущую роль на сегодняшний день играют индивидуальные методы. В значительной степени это связано с деликатностью процедуры «отъема знаний».
Рис. 1.31. Классификация методов работы с экспертами
Пассивные методы
Наблюдения
Метод наблюдения является единственным «чистым» методом, где инженер по знаниям не вмешивается в процесс работы эксперта и не навязывает ему какие-либо собственные представления. Выделяют две разновидности наблюдений:
· Наблюдение за реальным процессом.
· Наблюдение за имитацией процесса.
Сначала обычно применяют первую разновидность и наблюдают за реальным процессом на рабочем месте эксперта. Это помогает глубже понять предметную область и отметить все внешние особенности процедуры принятия решений, необходимые для проектирования интерфейса пользователя.
На втором этапе эксперт имитирует процесс. В таком режиме он менее напряжен и работает на «два фронта» — ведет профессиональную деятельность и одновременно демонстрирует ее.
Сеансы наблюдений предъявляют к инженеру по знаниям следующие требования:
· Владение техникой стенографии.
· Знакомство с методиками хронометрирования для четкого структурирования производственного процесса во времени.
· Развитые навыки «чтения по глазам», то есть наблюдательность к жестам, мимике и другим невербальным компонентам общения.
· Предварительное знакомство с предметной областью.
Протоколы наблюдений после проведения сеансов тщательно расшифровываются, а затем обсуждаются с экспертом.
Анализ протоколов «мыслей вслух»
При протоколировании «мыслей вслух» эксперта просят раскрыть всю цепочку рассуждений, объясняющих его действия и решения. При таком протоколировании считается важным зафиксировать не только весь «поток сознания» эксперта, но даже паузы и междометия в речи эксперта. Иногда данный метод называют «вербальными отчетами».
При протоколировании «мыслей вслух» эксперт может проявить себя максимально ярко. Он ничем не скован, ему никто не мешает, он как бы свободно парит в потоке собственных рассуждений и умозаключений, может блеснуть своей эрудицией и продемонстрировать глубину познаний. Для большого числа экспертов это самый приятный и лестный способ извлечения знаний.
Вместе с тем, как отмечалось выше, далеко не каждый специалист, даже из числа умеющих произносить впечатляющие монологи о своей работе, оказывается в состоянии формализовать и структурировать рассуждения. Однако существуют люди, склонные к рефлексии, способные к конструктивному изложению мыслей. Такие люди — находка для инженера по знаниям.
Лекции
Лекторский дар встречается нечасто. Опытный лектор хорошо структурирует свои знания и ход рассуждений. Но бывает, некоторые люди обладают лекторским
даром, но не подозревают о его присутствии. В любом случае инженеру па знаниям стоит попробовать озадачить эксперта подготовкой лекции на интересующую тему. Если эксперт сумеет преодолеть специфический психологический барьер и войти в образ педагога, это может оказаться весьма эффективным для решения задачи извлечения знаний.
Хороший вопрос инженера по знаниям по ходу лекции имеет важное значение. Серьезные, глубокие и интересные вопросы, с одной стороны, стимулируют творческое воображение лектора, и с другой — повышают авторитет инженера по знаниям.
Продолжительность лекций рекомендуется стандартная — от 40 до 50 минут, и через 5-10 минут — еще столько же. Весь курс должен занимать, как правило, от двух до пяти лекций.
Метод извлечения знаний в форме лекций, как и все пассивные методы, применяют в начале многоэтапной процедуры извлечения знаний из памяти эксперта. Он способствует быстрому погружению инженера по знаниям в предметную область.
Активные индивидуальные методы
Анкетирование
Анкетирование является наиболее стандартизированным методом. Составление анкеты — достаточно тонкий и ответственный момент. Вот несколько рекомендаций:
· анкета не должна быть монотонной и однообразной, чтобы не вызывать скуку и усталость. Для этого вопросы должны варьироваться, тематика меняться. Кроме того, нередко в анкету вставляют специальные вопросы-шутки и игровые вопросы;
· анкета должна быть приспособлена к языку экспертов;
· следует учитывать, что вопросы влияют друг на друга. Поэтому последовательность вопросов должна быть хорошо продумана;
· анкета должна иметь «хорошие манеры». Ее нужно излагать ясным, понятным и предельно вежливым языком. Методическим мастерством составления анкеты можно овладеть только на практике.
Процедура анкетирования может проводиться двумя способами, В первом аналитик вслух задает вопросы и сам заполняет анкету по ответам эксперта. Во втором эксперт заполняет анкету Самостоятельно после предварительного инструктирования.
Выбор способа зависит от ряда условий (в частности от оформления анкеты, ее понятности, готовности эксперта). Вместе с тем, второй способ представляется предпочтительным, так как у эксперта появляется неограниченное время на обдумывание вопросов и снижается так называемый эффект присутствия.
Интервью
Перед проведением интервью неплохо спросить себя: «А умеем ли мы задавать вопросы?» Рассмотрим классификацию вопросов.
Рис.1.32. Классификация вопросов
Открытый вопрос обозначает тему или предмет, предоставляя эксперту свободу по форме и содержанию ответа.
При закрытом вопросе эксперту предлагается набор ответов, среди которых он должен сделать выбор.
Закрытые вопросы легче обрабатываются, но они в определенной мере «программируют» ответ эксперта и «закрывают» ход его рассуждений. Поэтому при составлении сценария интервью обычно чередуют открытые и закрытые вопросы и особенно тщательно продумывают «меню» и содержание закрытых вопросов.
Личный вопрос апеллирует к индивидуальному опыту эксперта. Личные вопросы обычно активизируют мышление эксперта, «играют» на его самолюбии, украшают интервью.
Безличный вопрос нацелен на выявление наиболее распространенных и общепринятых закономерностей предметной области.
При подготовке вопросов учитывают, что языковые возможности эксперта, как правило, ограничены. Кроме того, имеют в виду, что из-за замкнутости, скованности и робости отдельные эксперты не могут сразу высказать свое мнение и предоставить требуемые знания. Поэтому часто используют не прямые вопросы, которые непосредственно указывают на предмет или тему, а косвенные, опосредованно направляющие внимание на актуальную проблему. Иногда в интересах дела приходится задавать несколько косвенных вопросов вместо одного прямого.
Вербальные вопросы — это традиционные устные вопросы.
Вопросы с использованием наглядного материала разнообразят интервью и снижают утомляемость эксперта. В качестве наглядного материала используют фотографии, рисунки и карточки.
Разделение вопросов по функции на основные, зондирующие и контрольные связано с тем, что нередко эксперт по каким-то причинам уходит в сторону от вопроса и основные вопросы интервью оказываются непродуктивными. Тогда аналитик применяет зондирующие вопросы, концентрирующие внимание эксперта в нужном направлении. Контрольные вопросы используют для проверки достоверности и объективности полученной информации.
Нейтральные вопросы носят беспристрастный характер. В то же время, наводящие вопросы заставляют эксперта прислушаться или даже принять во внимание позицию интервьюера.
Кроме приведенных в классификации, полезно различать и включать в интервью следующие виды вопросов:
· контактные («ломающие лед» между аналитиком и экспертом); О буферные (для разграничения различных тем интервью);
· оживляющие память экспертов (для реконструкции отдельных случаев из практики);
· «провоцирующие» (для получения спонтанных, неподготовленных ответов).
Свободный диалог
При свободном диалоге инженера по знаниям с экспертом отсутствует какой-либо регламентированный план. Однако эта форма извлечения знаний требует самой серьезной предварительной подготовки.
Рис. 1.33. Схема подготовки к интервью и свободному диалогу
Квалифицированная подготовка к диалогу — подлинная драматургия. В ее сценарии предусматривают плавное развитие процедуры извлечения знаний от приятного впечатления в начале беседы к профессиональному контакту через пробуждение интереса и завоевание доверия эксперта.
Для обеспечения желания эксперта продолжать беседу обычно производят «поглаживания» типа: «Я Вас понимаю...», «...Это очень интересно» и т. п. При этом поведение аналитика должно быть искренним, ведь давно известно, что лучшая уловка — избегать всяких уловок и относиться к собеседнику с истинным уважением и настоящим интересом.
Существует каталог свойств идеального интервьюера: «Он должен выглядеть здоровым, спокойным, уверенным, внушать доверие, быть искренним, веселым, проявлять интерес к беседе, быть опрятно одетым, ухоженным».
Игры с экспертом
В играх с экспертом инженер по знаниям берет на себя какую-либо роль в моделируемой ситуации. Например, это может быть роль Ученика, который на глазах у эксперта (Учителя), поправляющего Ученика, выполняет работу на заданную тему. Такая игра — хороший способ разговорить застенчивого эксперта.
Другой пример — игра в Специалиста (инженер по знаниям) и Консультанта (эксперт). Эта игра дает иногда впечатляющие результаты. приведем пример из классической литературы. Эксперт выступал в роли врача, хорошо знающего больного, а консультант задавал вопросы и делал прогноз о целесообразности применения того или иного вида лечения. Такая игра позволила установить, что требуется всего 30 вопросов для успешного прогноза, в то время как первоначальный вариант вопросника, составленного медиками, содержал 170 вопросов.
Для выявления скрытых пластов знания применяется игра, в которой специалист делает прогнозы в профессиональных ситуациях и дает им обоснования. Затем по истечении определенного времени специалисту предъявляют его собственные обоснования и просят произвести по ним прогнозы. Как оказывается, такой простой прием нередко позволяет обнаружить пропущенные шаги в рассуждениях эксперта.
В игре «фокусировка на контексте» эксперт выполняет роль экспертной системы, а инженер по знаниям — роль пользователя. Моделируется ситуация консультации. Первые реакции эксперта концентрируются вокруг наиболее значимых понятий и самых важных аспектов проблемы.
В целом по играм с экспертом даются следующие основные советы инженеру по знаниям:
· Играйте смелее, придумывайте игры сами.
· Не навязывайте игру эксперту, если он не расположен.
· Не «давите» на эксперта, не забывайте цели игры.
· Не забывайте о времени и о том, что игра утомительна для эксперта.
· Играйте весело, нешаблонно.
Активные групповые методы
Активные групповые методы сами по себе не могут служить источником более или менее полного, знания. Они выступают как дополнительные и служат хорошим дополнением к индивидуальным методам извлечения знаний, активизирующим мышление и поведение экспертов.
«Круглый стол»
Метод круглого стола предполагает равноправное обсуждение интересующей проблемы несколькими экспертами. Задача дискуссии — коллективно, с разных точек зрения, под разными углами исследовать спорные проблемы предметной области. Для остроты на «круглый стол» приглашают представителей различных научных направлений и поколений. Число участников дискуссии обычно колеблется от трех до пяти-семи.
Перед началом дискуссии ведущему (инженеру по знаниям) необходимо убедиться, что все участники правильно понимают задачу. Затем нужно установить регламент и четко сформулировать тему.
По ходу дискуссии важно проследить, чтобы слишком эмоциональные и разговорчивые эксперты не подменяли тему и чтобы критика позиций друг друга была обоснованной. Определенные усилия ведущий должен приложить для уменьшения «эффекта фасада», когда у участников превалирует желание произвести впечатление на других и они говорят совсем не то, что сказали бы в нормальной обстановке.
«Мозговой штурм»
«Мозговой штурм» или «мозговая атака» - один из наиболее популярных методов раскрепощения и активизации человеческого мышления. Впервые этот метод был использован в 1939 году А. Осборном в США для генерации новых идей.
Основное положение штурма — отделение процедуры генерации идей в замкнутой группе специалистов от процесса их анализа и оценки. Обычная продолжительность штурма — порядка 40 минут. Количество участников — до 10 человек. Этим участникам предлагается высказать на заданную тему любые мысли, в том числе шутливые, фантастические и ошибочные. Критика запрещена. Регламент — до 2 минут на выступление.
Из опыта известно, что число высказанных идей Часто превышает 50. Наиболее существенный момент штурма — наступление пика (ажиотажа), когда идеи начинают буквально «фонтанировать». Последующий анализ, который проводит группа сторонних экспертов, как правило, показывает, что всего лишь 10-15 % идей разумны, но среди них встречаются весьма оригинальные.
Искусство инженера по знаниям, проводящего «мозговой штурм», заключается в способности задавать вопросы аудитории, «подогревая» аудиторию. Вопросы служат своеобразным «крючком», которым извлекаются идеи.
Ролевые игры в группе
В каждой групповой игре заранее составляется сценарий, распределяются роли, готовятся портреты-описания ролей и разрабатывается система оценивания игроков.
Известны различные способы проведения ролевых игр. В одних играх участники придумывают себе новые имена и выступают под ними. В других все игроки переходят на «ты». В третьих роли выбирают игроки, в четвертых для распределения ролей вытягивается жребий.
Обычно в игре, предназначенной для получения знания, принимают участие от трех до шести экспертов: В случае большего числа экспертов они разбиваются на группы, между которыми организуется состязание: чей диагноз окажется ближе к истинному, чей план рациональнее использует ресурсы, кто быстрее определит неисправность в техническом блоке и т. п.
Создание игровой обстановки требует фантазии и выдумки от инженера по знаниям. Главное, чтобы эксперты в игре максимально погрузилась в ситуацию, действительно «заиграли», раскрепостились и «раскрыли свои карты».
Требования и инженеру по знаниям
Завершая сжатое рассмотрение на самом деле обширной области инженерии знаний отметим ряд основных требований к инженеру по знаниям.
· Инженер по знаниям должен иметь хорошую теоретическую подготовку в области моделей представления знаний, с тем чтобы оптимально выбирать и спользовать возможности моделей представления знаний для решения посталенной задачи.
· Хотя это не было ранее сформулировано явно, но из изложения материала понятно, что инженер по знаниям должен обладать отличными коммуникационными навыками и иметь некоторые познания в области психологии общения с тем, чтобы продуктивно работать с экспертами.
· Инженер по знаниям должен обладать системным мышлением и владеть методами анализа предметной области, методами когнитивной психологии.
· Иметь комплексную общенаучную подготовку и свободно владеть методами научного исследования, формальными методами описания и документирования.
· Свободно ориентироваться в области информационных технологий.
Роль инженера по знаниям при разработке интеллектуальных информационных систем часто является ключевой для успеха проекта системы. Как правило инженерами по знаниям становятся специалисты – разработчики программного обеспечения и аналитики, обладающие необходимыми навыками и склонностями. Отметим в заключение, что роль инженера по знаниям во многом схожа с функциями аналитиков и специалистов по внедрению при разработке обычных информационных систем.
Стратегии поиска в СОЗ