Описание множества проблем, для решения которых необходимо экспертное знание
Вполне обосновано предположение, что для сравнительно узкой профессиональной области эксперт может указать набор диагностических признаков, необходимых ему для постановки диагноза. Поясним понятие сравнительно узкой области профессиональной деятельности: диагностика одного заболевания, дифференциальная диагностика между двумя заболеваниями.
Для каждой такой области эксперт называет необходимые диагностические признаки и их возможные значения. Заметим при этом, что множество значений диагностического признака всегда дискретно. Даже в случае, казалось бы, непрерывной шкалы признака (например, артериальное давление), эксперт выделяет несколько информативных для него значений или диапазонов значений (например, повышенное, нормальное или пониженное артериальное давление). Чаще всего врач-эксперт использует при диагностике 2 - 4 значения на шкале каждого диагностического признака.
Комбинируя значения диагностических признаков, можно создавать клинические ситуации(КС). Каждая КС содержит описание (на языке, данном экспертом) одного из возможных пациентов. Легко подсчитать, что общее число КС равно произведению числа значений на шкалах всех диагностических признаков. Число КС - это количество различных пациентов (размерность пространства), для анализа и диагностики которых нам необходимо выявить экспертное знание.
Множество КС в данной профессиональной области создают пространство проблем.Приведем численные примеры. При пяти диагностических признаках с тремя значениями на шкале каждого из них пространство содержит З 5 = 283 проблемы. А при 10 признаках (часто встречаются в задачах медицинской диагностики) и двух значениях на шкалах имеется 1024 проблемы, при трех значениях - 80089 проблем.
Приведем конкретный пример. В [1] рассматривается проблема построения экспертной системы для диагностики острых медикоментозных отравлений. Для построения одной из подсистем необходимо создать базу знаний, имитирующую решения эксперта при диагностике отравлений барбитуратами. Типичным лекарством этой группы является амитриптилин. Предположим, что пациент находится в коматозном состоянии.
Ниже приведен список диагностических признаков и их значений, необходимых для эксперта при диагностике отравлений барбитуратами.
Признаки и их значения, используемые экспертом при диагностике отравлений барбитуратами
1. Поведение пациента до комы
1.1. Моторное возбуждение, агрессивность 1.2 Галлюцинации, тактильные и слуховые
2. Цвет кожи
2.1. Нормальный
2.2. Гиперемия
3. Судороги
3.1. Есть судороги
3.2. Нет судорог
4. Зрачки
4.1. Расширенные зрачки
4.2. Суженные зрачки
5. Пульс
5.1. Тахикардия (пульс больше 110)
5.2. Умеренная тахикардия (пульс 90 - 100)
6. Характеристика пульса
6.2. Аритмия
6.3. Нормальный, нет аритмии
6.2. Упорядочение значений признаков по характерности
Другим видом экспертного знания, которое можно получить при первичном анализе профессиональной области, является упорядочение значений признаков по характерности для различных заболеваний. Так, при дифференциальной диагностике выдвигается гипотеза, что для каждого из диагностических признаков эксперт может упорядочить значения по характерности.
стр. 59
Упорядочение по характерности вводит определенный порядок в пространстве проблем: выделяются более и менее типичные КС по отношению к разным заболеваниям.
Отметим, что в списке первое значение каждого признака более характерно для отравления барбитуратами, чем второе.
6.3. Получение экспертных знаний
Центральным элементом подхода СЗ является выявление знаний путем предъявления эксперту КС - целостного образа объекта, описанного на языке значений диагностических признаков. Отметим, что именно с такой задачей сталкивается эксперт в своей практической деятельности. Специальный алгоритм формирует КС из значений диагностических признаков и предъявляет эксперту на экране компьютера.
Используя приведенный выше пример, представим возможный вопрос эксперту. Состояние пациента описывается следующим образом:
"Пациент в коме; до комы было моторное возбуждение, агрессия; Цвет кожи - гиперемия; Судороги; Расширенные зрачки; Пульс - тахикардия, аритмии нет. Определите один из двух диагнозов:
С 1 - есть подозрение на отравление барбитуратами;
С 2 - нет подозрения на отравление барбитуратами".
В отличие от широко распространенного способа построения экспертных систем мы не пытаемся выявлять и представлять экспертное знание в виде продукций, исходя из того, что это знание "ситуативно" и каждый образ КС определяет для эксперта принадлежность КС к одному из классов решений.
Конечно, компьютерная система не предъявляет все КС эксперту, так как, в общем случае, их оценка потребовала бы исключительно больших затрат времени. Используется гипотеза о том, что классификация менее характерных(для данного класса) КС определяет классификацию более характерных(с точки зрения значений диагностических признаков) КС. Эта гипотеза проверяется при построении полной классификации КС. Мы называем ее гипотезой доминирования по характерности.
Обратимся к приведенному выше примеру. Пусть эксперт определил для предъявленной КС первый класс решений: С 1 - есть подозрение на отравление барбитуратами". В этой КС значения двух признаков: "Цвет кожи" и "Характеристика пульса" не характерны для первого класса. Используя решение эксперта и гипотезу доминирования по характерности, можно отнести к первому классу еще три КС, отличающихся от приведенной выше более характерными значениями одного или двух этих признаков.
Подход СЗ реализован в виде совокупности компьютерных программ, которые продолжают опрос эксперта до построения полной и непротиворечивой классификации всех КС. Эффективность программ такова, что они позволяют классифицировать 500 - 700 КС за час работы эксперта [2]. При этом программы позволяют получить точную копию экспертных знаний (см. далее).
Отметим еще раз существенное отличие систем, построенных на основе подхода СЗ, от обычных экспертных систем. Прежде всего КС не рассматриваются как продукции. Поэтому нет нужды в блоке логического вывода: для всех КС установлен класс решений. Гипотеза доминирования по характерности предполагает распространение классификации одних КС на другие, причем данная гипотеза проверяется.
7. ГРАНИЧНЫЕ ЭЛЕМЕНТЫ КЛАССИФИКАЦИИ
После построения полной классификации КС в пространстве проблем можно выделить все КС, относящиеся к каждому из классов решений. Рассмотрим КС, относящиеся к одному классу, используя отношение характерности. Можно выделить наиболее характерные для данного класса (содержащие весьма часто встречающиеся для данного класса значения диагностических признаков) и наименее характерные. Формально говоря, можно выделить верхнее и нижнее множества Парето. Так, при дифференциальной диагностике двух заболеваний в каждом классе имеется одна КС, наиболее типичная для соответствующего заболевания: сочетание всех наиболее типичных для него значений диагностических признаков. Нижнее множество Парето представляют КС, содержащие лишь несколько характерных для каждого заболевания значений признаков. Целостный образ КС определяет, по мнению эксперта, ее принадлежность к тому или иному диагнозу. Назовем такие КС граничными[3].
Формально граничные КС определяются следующими условиями:
1) Граничная КС не доминирует по характерности над другой КС, принадлежащей к этому же классу (иначе говоря, она наименее характерна для данного класса).
2) При изменении значения хотя бы одного их диагностических признаков возникает новая КС, принадлежащая к другому классу (иначе говоря, две КС, отличающиеся лишь значением одного диагностического признака, находятся как бы "по соседству").
Отметим, что граничные объекты всех классов полностью представляют собой результат проведенной экспертом классификации. Действительно, принадлежность произвольного объек-
стр. 60
та к классу решений можно установить путем сравнения с граничными объектами. Объект принадлежит определенному классу, если он менее характерен для него, чем какой-либо из верхних граничных объектов, и/или более характерен, чем какой-либо из нижних граничных объектов. Нижние граничные КС представляют собой наиболее трудные (для данного эксперта) для диагностики случаи, т.е. наименее типичные для данного класса решений. Отметим, что принадлежность граничных КС к классу решений всегда выявляется при их непосредственной классификации экспертом.
8. ПРОВЕРКА ТОЧНОСТИ ИМИТАЦИИ ЭКСПЕРТНЫХ СУЖДЕНИЙ
Так как граничные объекты представляют наиболее сложные КС, то естественно проверить точность имитации экспертных суждений путем повторного предъявления их эксперту. Таким способом неоднократно проверялись построенные классификации. В задачах с небольшим количеством проблем (до 200) качество имитации проверялось путем сравнения классификации при предъявлении каждого из объектов с классификацией, построенной через 2 - 3 недели изложенным выше способом. Совпадение было практически полным: различия в 2 - 3 объектах. При большом количестве проблем качество имитации проверялось путем повторного предъявления эксперту наиболее сложных из них через какое-то время. Совпадение было практически полным.
Можно сделать вывод, что при прочных экспертных знаниях подход СЗ позволяет получить их точную имитацию.
9. ПОДСОЗНАТЕЛЬНЫЕ РЕШАЮЩИЕ ПРАВИЛА
Анализ выявленных граничных объектов показал, что они не представляют собой случайный набор КС. Напротив, группы КС имеют одинаковую структуру, одинаковое число наиболее типичных и нетипичных значений диагностических признаков. Объединение КС в группы позволило выдвинуть гипотезу о скрытых, подсознательных решающих правилах, существующих в памяти эксперта и используемых им при классификации [3]. Эта гипотеза многократно проверялась при построении различных классификаций [18].
Оказалось, что в общем случае решающее правило эксперта может быть представлено в виде дерева значений признаков:
где N - количество диагностических признаков; - конъюнкция характерных и наиболее важных для данного класса значений п диагностических признаков;
- сочетания по k из N-n, характерных для данного класса значений из остальных диагностических признаков.
В частных случаях первая или вторая часть в этом правиле может отсутствовать.
Так, для проблемы острого отравления барбитуратами (см. выше) одно из экспертных решающих правил звучит так:
"Имеется подозрение на острое отравление барбитуратами в случаях, когда до комы было моторное возбуждение, агрессия и не менее чем для трех диагностических признаков из оставшихся пяти имеются характерные значения такого отравления".
Чаще всего граничные объекты одного класса описываются 1 - 3 подобными решающими правилами. В экспериментах, приведенных в [4], было выявлено, что небольшая часть граничных объектов, соответствующих правилу, может отсутствовать. Однако при их внимательном анализе и повторной классификации экспертом решающее правило подтверждалось. На наш взгляд, даже самый опытный эксперт не может быть уверен полностью при классификации ранее не встречавшихся и трудных для него КС.
Как можно показать, что эксперт действительно использует выявленные решающие правила при классификации? При проведении экспериментов фиксировалось время, затраченное экспертом при классификации каждого объекта. Оказалось, что время, затрачиваемое при классификации граничных объектов, существенно больше, чем при классификации остальных.
Табл. 1 характеризует решения эксперта при задаче классификации с 6-ю диагностическими признаками: среднее время, затрачиваемое экспертом при классификации КС.
Наиболее правдоподобным объяснением такого поведения эксперта является предположение, что при классификации граничного объекта он сравнивает его с несколькими решающими правилами (двух соседних классов), прежде чем принять окончательные решения.
Данные правила, описывающие группы граничных объектов и выявленные с помощью подхода СЗ, предъявлялись экспертам - их "авторам". После размышлений и анализа решающие правила обычно получали одобрение такого экс-
Таблица 1. Среднее время (в с), затрачиваемое экспертом на классификацию одной КС при двух классах решений и шести бинарных диагностических признаках
КС | Класс | |
I | II | |
Внутри класса | 24.6 | |
На границе класса | 48.7 | 43.75 |
стр. 61
Таблица 2. Количество экспертных правил для проблем различной размерности
L | ||||||||||
F |
L - размерность проблемы (произведение количества значений на шкалах диагностических признаков); F - число решающих правил эксперта.
перта. В одном случае при 6-ти диагностических признаках [4] все объекты одного класса были выписаны на отдельных карточках и переданы эксперту с просьбой указать общие правила, "объединяющие" эти объекты. Эксперт указал только часть правил, относящихся к некоторым объектам. Все это показывает, что выявленные с помощью подхода СЗ решающие правила являются подсознательными. Их нельзя обнаружить путем "мышления вслух", использования вербальных протоколов (основное средство выявления экспертных знаний при символьном подходе). Они могут быть установлены только в результате анализа совокупности действий эксперта, выполняемых в конкретных ситуациях.
Интересно, что общее количество решающих правил, выявленных в различных задачах медицинской диагностики, невелико и не превышает 7 - 9 (объем кратковременной памяти).
Табл. 2 представляет опыт применения подхода СЗ в задачах медицинской диагностики: количество экспертных правил для задач с различным числом проблем [18].
Из табл. 2 следует, что количество решающих правил не определяется размерностью проблемы, оно характеризует человеческую систему переработки информации, возможности ее приспособления к задачам различной размерности. На наш взгляд, такая возможность является присущей человеку, но для ее реализации требуются определенные личностные характеристики и не менее десяти лет интенсивной практики [15].
10. ТЕОРИЯ ПОДСОЗНАТЕЛЬНЫХ РЕШАЮЩИХ ПРАВИЛ (ПРП-ТЕОРИЯ)
Итак, классификация, точно имитирующая экспертные решения, может быть представлена несколькими решающими правилами, почти однозначно восстанавливаемыми из граничных объектов. Количество решающих правил не превышает объема кратковременной памяти, что объясняет быстроту их использования.
Можно предположить, что такие правила подсознательно формируются в памяти эксперта в течение многих (не менее 10 [15]) лет интенсивной практики. Именно с их помощью происходит "распознавание" нового объекта.
На основании полученных данных можно выдвинуть теорию подсознательных решающих правил (ПРП), которая следующим образом описывает поведение эксперта в задачах классификации. На основе конкретного вербального описания объекта у эксперта возникает его целостный, содержательный образ. Далее эксперт подсознательно сравнивает его с имеющимися в оперативной памяти и выработанными за годы практики решающими правилами, которые находятся в рабочей памяти и могут быть быстро использованы. Таким образом, осуществляется распознавание объекта и отнесение его к одному из классов решений.
На основании ПРП-теории структура памяти эксперта может быть представлена следующим образом. На нижнем уровне находится слой из нескольких сотен или тысяч реальных объектов, представляющих практические случаи, встретившиеся эксперту за время его деятельности. Описания этих объектов легко могут быть вербализованы. Вспоминание трудных случаев, извлечение их из памяти происходит, когда эксперт в ходе диагностики встречает особенно сложный объект. Следующий слой - подсознательные решающие правила, выработанные годами на основе реальных объектов. Некоторые из них могут быть не до конца сформированы. Но быстрота принятия решений, типичная для эксперта, позволяет предположить, что недостающие объекты скорее будут "упакованы" в имеющиеся структуры, чем внесены в "лист исключений". Как мы уже отмечали, подсознательные решающие правила не могут быть вербализованы.
Верхний слой представляет собой набор информативных признаков и их значений, также выработанный экспертом в результате многолетней практики. Он может быть вербализован.
11. СЛЕДСТВИЯ ДЛЯ ТЕОРИИ И ПРАКТИКИ
Изложенный выше подход к выявлению экспертных знаний не является, конечно, единственным. Возможности новых технологий искусственного интеллекта, таких, как, например, нейронные сети, генетические алгоритмы, многоагентные системы, еще полностью не исследованы. Но полученные результаты позволяют поставить ряд новых теоретических и практических задач.
Прежде всего желательно найти способ классификации реальных проблем окружающего нас мира на три класса.
Первый класс: проблемы допускают декомпозицию на отдельные компоненты их описания без ущерба для их содержания.
стр. 62
Второй класс: проблемы в целом или частично имеют целостный, "ситуативный" характер, но возможна достаточно точная аппроксимация решающих правил определенной функцией от отдельных компонент описания.
Третий класс: отдельные компоненты описания проблемы столь сильно взаимосвязаны, что такая аппроксимация искажает описание проблемы.
Представляется, что многие инженерные, геологические проблемы относятся к первым двум классам, а медицинские - к третьему классу.
Так как подсознательный характер экспертных знаний очевиден, то скорее всего экспертные знания в самых различных проблемах могут быть представлены в виде достаточно простых по своей структуре решающих правил. Такое предположение соответствует современному уровню знаний о человеческой системе переработки информации.
С чисто практической точки зрения важно выявление экспертных знаний на полном множестве проблем в рассматриваемой предметной области. Такой подход может помочь найти целостный облик экспертного знания.
12. ЗАКЛЮЧЕНИЕ
На основе опыта многолетней работы в области медицинской диагностики мы можем сделать вывод о "ситуативности" экспертного мышления. Следует в то же время подчеркнуть, что механизм распознавания объектов экспертом может быть правдоподобно описан на основе символьной теории. Подсознательные решающие правила можно рассматривать как специальные символы, имеющие подсознательный характер. В рамках ПРП-теории оба подхода справедливы.
Наряду с построением экспертных систем путем имитации поведения эксперта на основе подхода СЗ ПРП-теория позволила создать компьютерную систему ОСТЭЛА [6]. Эта система предназначена для обучения искусству диагностики тромбоэмболии легочной артерии на основе решающих правил эксперта.
В системе ОСТЭЛА используется принцип подсознательного обучения, когда обучаемый (молодой врач) должен сам воссоздать правила диагностики, а система предъявляет множество КС (начиная от легких и переходя к трудным) и сообщает ему лишь о правильности его решения, причем за эталон берутся выявленные ранее подсознательные решающие правила эксперта.
Помимо медицины подход СЗ и ПРП-теория могут быть распространены на другие области человеческой деятельности.
СПИСОК ЛИТЕРАТУРЫ
1. Асанов А. А., Ларичев О. И., Нарыжный Е. В., Страхов С. М. ЭСТЕР - экспертная система для диагностики острых отравлений лекарствами // Тр. VII национальной конференции по искусственному интеллекту. М.: Физматлит, 2000. С. 708 - 716.
2. Ларичев О. И., Асанов А. А. Метод ЦИКЛ порядковой классификации многокритериальных альтернатив // ДАН. 2000. N 5. С. 592 - 596.
3. Ларичев О. И. Структура экспертных знаний в задачах классификации // ДАН. 1994. N 6. С. 750 - 752.
4. Ларичев О. И. Структуры экспертных знаний // Психологический журнал. 1995. N 3. С. 82 - 89.
5. Ларичев О. М., Мечитов А. И., Мошкович Е. М., Фуремс Е. М. Выявление экспертных знаний. М.: Наука, 1989.
6. Ларичев О. М., Нарыжный Е. В. Компьютерное обучение процедуральным знаниям // Психол. журнал. 1999. N 6. С. 53 - 61.
7. Нильсон Н. Искусственный интеллект. М.: Мир, 1973.
8. Саймон Г. Науки об искусственном. М.: Мир, 1972.
9. Саймон Г., Чинг Ц. Распознавание, мышление и обучение как информационные процессы // Психол. журн. 1988. N 2. С. 33^6.
10. Anderson J. R. The Architecture of a Cognition. MA: Harvard University Press, 1983.
11. Boshuizen H. P. A., Schmidt H. G. On the role of biomedical knowledge in clinical reasoning by Experts, Intermediates, and Novices //Cognitive Science. 1992. N 16. P. 153 - 184.
12. Clancey W. J. The epistemology of a rule-based expert systems. Framework for explanation // Artificial Intelligence. 1983. N 20 (3). P. 215 - 225.
13. Clancey W. J. Notes on "Epistemology of a rule-based expert system"// Artificial Intelligence. 1993. N 59. P. 197 - 204.
14. Dreyfus H. L., Dreyfus S. E. Making a mind versus modeling the brain: artificial intelligence back at a branchpoint // The philosophy of artificial intelligence / Ed. M. Boden. Oxford: Oxford University Press. 1985. P. 307 - 333.
15. Ericsson K. A. The Acquisition of Expert Performance: An Introduction to Some of the Issues // The Road to Excellence: The Acquisition of Expert Performance in the Arts and Sciences, Sports and Games / Ed. K. A. Ericsson. Hills- dale, NJ.: Lawrence Erlbaum Associates. 1996. P. 1 - 51.
16. Greeno J. G. The Situativity of Knowing, Learning and Research. American Psychologist. 1998, January. P. 5 - 26.
17. Kihlstrom J. F. The Cognitive Unconscious // Science. 1987. V. 237. P. 1445 - 1452.
18. Larichev O. I. Close Imitiation of Expert Knowledge: The Problem and Methods // International J. of Information Technology & Decision Making. 2002. N 1. P. 27 - 42.
19. Mechner D. A. All Systems Go // The Sciences. 1998, Jan. P. 30 - 38.
20. Newell A., Simon H. A. Human Problem Solving. Engle-wood Cliffs, NJ: Prentice-Hall Inc., 1972.
21. Newell A., Simon H. Computer science as empirical enquiry: symbols and search // The philosophy of artificial intelligence / Ed. M. Boden. Oxford: Oxford University Press, 1990.
22. Nilsson N. Artificial intelligence. A new Synthesis. San Francisco: Morgan Kaufmann Publishers, 1998.
23. Patel V., Groen G. The general and specific nature of medical expertise: a critical look // Toward a general the-
стр. 63
ory of expertise / Ed. K. A. Ericsson and J. Smith. Cambridge: Cambridge Univ. Press, 1991. P. 93 - 125.
24. Pople H. The formation of composite hypothesis in diagnostic problem solving-An exercise in sythetic reasoning // IJCAI. 5. P. 1030 - 1037.
25. Rodolih N. S., Clancey W. J. GUIDON - MANAGE: teaching the process of medical diagnosis // Medical Cognitive Science / Ed. D. Evans, V. Patel. Cambridge: Bradford Books, 1989. P. 313 - 348.
26. Simon H. Reason in Human Affairs. Stanford: Stanford University Press, 1983.