Парадигма «моделирования знаний»
Основная предпосылка инженерии знаний в рамках второй парадигмы заключается в том, что знание чего-либо есть способность человека к формированию образа ситуации, образа мира или менталь-ньосмоделей (теп1а1 mойе», которые с той или иной степенью точности представляют как объекты, так и действия, выполняемые с этими объектами. Гипотеза о том, что люди понимают мир путем построения ментальных моделей, ставит фундаментальные вопросы во всех областях когнитивных исследований.
□ В когнитивной психологии: Как эти модели представляются человеком, как они взаимодействуют с механизмами памяти, восприятия, внимания и мышления и как они воздействуют на поведение индивида или контролируют его?
□ В лингвистике: Какова взаимосвязь между словом как именем объекта и ментальной моделью? Каковы синтаксические и семантические правила, связывающие ментальные модели со смыслом?
□ В философии: Какова взаимосвязь между знанием, значением и ментальными моделями? Как эти модели используются для умозаключений (или рассуждений) и как рассуждения человека связаны с формальной логикой?
□ ВобластикомПъютерныхнаукилиинформатики(сотРШег8*епсе): Как можно отразить персональную модель мира в компьютерной системе? Какие языки и инструменты необходимы для описания таких моделей и их связи с другими системами? Может ли модельподдерживатьтакой компьютерный интерфейс, который люди находили бы наиболее легким в использовании?
Таким образом, инженерия знаний является междисциплинарной наукой, объединяя или синтезируя, с одной стороны, исследования в области когнитивных наук (соёпШуе зс1епce), в состав которых входят философия, психология и лингвистика, а с другой - исследования в области искусственного интеллекта, занимающегося разработкой интеллектуальных систем.
В русле парадигмы «моделирования знаний» осногная задача инженерии знаний - предоставить специалистам-разработчикам интеллектуальных систем эффективную технологию, способы, методы построения моделей, отражающих понимание экспертом предметной области в целом и стратегий рассуждений при решении конкретных задач. Такая технология должна дать ответы на вопросы о том, как взаимодействовать с экспертом, как строить модели, с чего начинать, как фиксировать полученные от эксперта знания на промежуточных эта-
Компьютерная психодиагностика
пах,какописыватьопределенныефеноменызнаний,какиеформализ-мы инженерии знаний следует при этом использовать. Ответ на эти вопросы содержится в следующих разделах.
Извлечение знаний
Как следует из определения, технология инженерии знаний предполагает последовательное прохождение этапов извлечения знаний и концептуального анализа знаний.
Этап извлечения знаний касается выбора формы взаимодействия инженера по знаниям с экспертом. Основной вопрос, который должен быть решен, - это «как» взаимодействовать с экспертом, чтобы получить наиболее полное представление о предметной области и существующих в ней способах принятия решения. Диапазон форм взаимодействия инженера по знаниям с экспертом может быть достаточно широким: от неформальных бесед, интервью, наблюдений, лекций, диалогов, экспертных игр и экспериментов до использования формализованных процедур и компьютерных программ.
Основные аспекты взаимодействия инженера по знаниям с экспертом, стратегии получения экспертных знаний и опыта, а также методы извлечения знаний подробно рассматриваются в этом разделе.
Этап концептуального анализа знаний касается несколько иного аспекта при взаимодействии инженера по знаниям с экспертом. Вопрос заключается не в том, как организовать процесс взаимодействия с экспертом, а в том, «что» надо получить в результате такого взаимодействия и «как» структурировать полученную информацию для решения данной задачи. Концептуальный анализ знаний начинается с выявления терминологии, базовых понятий предметной области, взаимосвязей, семантических отношений, метапонятий, стратегий принятия решений и заканчивается построением модели предметной области. Фактически речь идет о том, чтобы полученные на предыдущем этапе знания перенести в некоторые концептуальные структуры, не зависящие от конкретной программной реализации.
Для осуществления такой работы существуют вполне конкретные структуры и методы, позволяющие выявлять определенные элементы знаний. Подробно концептуальный анализ знаний рассматривается в п. 3.2.3 и 3.2.4, здесь же рассмотрим проблему извлечения знаний.
В англоязычной литературе по инженерии знаний существует понятие «экспертное^» (ехрейие), под которым понимается набор качеств, лежащих в основе высокого уровня работы людей-специалис-
Глава 3. Конструирование компьютерных психодиагностических методик
тов, в том числе обширные познания в той или иной области, эвристические правила, упрощающие и улучшающие подходы к решению задач, метазнания и метасознание, а также «компилированные» формы поведения (навыки), обеспечивающие большую экономию при высококвалифицированной работе [Хейес-Рот, Уотерман, Ленат, 1987]. Иными словами, экспертное^ - это знания, опыт и компетентность, которыми владеет эксперт.
Не? Под извлечением экспертных знаний (кпслу1ес18е еНскаНоn) по-) нимается процедура взаимодействия инженера по знаниям с экспертом, в результате которой становятся явными процесс рассуждений специалистов при принятии решений и структура их представлений о предметной области.
Проблема извлечения экспертных знаний традиционно считается «узким местом» в проектировании интеллектуальных систем [Рещеп-Ьаит, 1980; Воозе, 1989; Сатез, 1993]. По количеству цитируемое™ в литературе это изречение стало классическим и довольно точно отражает состояние дел. В чем же заключаются трудности извлечения экспертных знаний?
Ответы на эти вопросы дают психологические и психолингвистические исследования, касающиеся широкого круга проблем: как формирование опыта решения профессиональных задач специалистами и пониманиеприродыэкспертности,применениетеоретическихзнаний на практике и специфика практического мышления, характеристика системы обработки информации человеком и поведение человека при решении профессиональных задач, а также взаимосвязь естественно- • го языка и мыслительного процесса человека.
Вопросы понимания природы экспертное™ достаточно широко освещены в литературе по психологии [ВгоаНЬеМ е( а1., 1986; №зЪе«, \УП<юп, 1977]. Так, например, анализ природы экспертное™ говорит о ее сильном ограничении и зависимости от некоторых неявно выраженных допущений [НауЛйм, 1983], а обзор исследований, сделанных на этутемупоказывает^томногоевдеятельностичеловекадоконцаосоз-нать невозможно [Dкоn, 1981].
В психологических исследованиях зависимости между компетентностью человека в отношении реальных профессиональных проблем и уровнем его интеллекта сделан вывод о том, что эти две характеристики не связаны между собой [Холодная, 1997]. Так, при прогнозировании результатов конных скачек опытные знатоки, независимо от величины своего коэффициента интеллекта (К}), обнаруживали более
Компьютерная психодиагностика
высокие показатели умозаключающей способности и многовариантность суждений, в отличие от «новичков».
Известен парадоксальный факт: по мере накопления опыта специалист-эксперт все больше и больше утрачивает умение словесно выражать свои знания. Существует достаточно убедительное доказательство того, что люди не всегда в состоянии достоверно описать свои мыслительные процессы. Известный теоретик искусственного интеллекта М. Минский писал, что «самосознание - это сложная, но тщательно сконструированная иллюзия...» и что «...только как исключение, а не как правило, человек может объяснить то, что он знает» [цит. по: Кук, Макдональд,1986.С.146].
Другая психологическая гипотеза утверждает, что опыт эксперта -это интуиция, которая трудно поддается выражению в форме правил типа «ЕСЛИ - ТО». Психологические исследования сущности профессионального опыта показывают, что свойство, которое мы называем интуицией, на самом деле может быть высокоразвитой способностью распознавать образы. Например, шахматисты высокого класса способны быстро распознавать и восстанавливать в памяти именно игровое расположение фигур на доске, а не случайное. Кроме того, доказано, что опытный специалист отличается от новичка не только своими знаниями, но и их организацией [Кук, Макдональд, 1986].
Результаты экспериментов по изучению человеческого опыта на основании сравнения когнитивных структур новичков и опытных специалистов [Кук, Макдональд, 1986] показали, что когнитивные структуры профессионалов мало чем различаются между собой и сильно разнятся с когнитивными структурами новичков.
R. С1а8ек (1984), исследуя способы решения задач опытными физиками и новичками, сделал вывод о том, что «...связь между структурой базы знаний и процессом решения задач опосредуется качеством репрезентации проблемы...», а «...характеристики репрезентации проблемы оказываются обусловленными имеющимися у субъекта знаниями и способами, которыми это знание организовано» [01азек, 1984. С. 98]. Так, например, эксперты-физики (специалисты) сначала строят физическую репрезентацию проблемы и только потом начинают ее решать, тогда как новички (студенты) более быстро и непосредственно переходят к процессу решения. Далее, эксперты-физики строят репрезентации вокруг фундаментальных принципов, которые характеризуют наиболее обобщенное, а также «подразумеваемое» знание (1асИ кпо^е^е) (последнее выступает в виде сложных интуитивных представлений, далеко не всегда четко вербализованных), тогда как новички - вокруг доминантных объектов, которые представлены в соответ-
Глава 3. Конструирование компьютерных психодиагностических методик
ствующей физической ситуации в явном, очевидном виде. Кроме того, знания экспертов включают знания о возможности применения того, что они знают. Наконец, они успешно извлекают из собственных знаний необходимые для планирования своих дальнейших действий сведения [Холодная, 1997].
Анализ протоколов решения физических задач экспертами и новичками, сделанный другими авторами, также показывает, что эксперт решает задачу с помощью «физической» репрезентации феномена и лишь затем выводит уравнение, а новичок, напротив, не создает такой физической репрезентации и прямо применяет формулы к данным условия задачи [8шюп D. P., 54топ Н. А., 1978].
Интеллектуальныедостиженияэкспертаявляютсяследствиемосо-бой формы организации его индивидуальных знаний - как декларативных («что?»), так и процедурных («как?») [Сш, Коезке, 1983]. Так, М. Чи обследовала ребенка-вундеркинда четырех с половиной лет, который увлекался проблемой динозавров (у него было много книг о динозаврах и разнообразных моделей этих животных). На основе анализа бесед с ребенком и характера его игры с моделями Чи пришла к выводу, что интеллектуальная одаренность этого мальчика была связана со специфическими характеристиками индивидуальной базы знаний, касающихся темы «динозавры»: большим количеством единиц знания, наличием большого числа разнонаправленных связей между ними, высокой степенью их сцепленности (например, существованием очень тесных связей между понятиями о главных динозаврах), а также высокой степенью их иерархичности (этот ребенок четко разделял общие и частные признаки динозавров).
Наблюдения некоторых авторов говорят о том, что эксперты переходят от описания задачи к ее решению без каких-либо промежуточных рассуждений. В большинстве случаев это решение не только правильное, но и быстрое. Такая стратегия сильно отличается от «обратной» стратегии, которую обычно используют новички: от цели - к подцелям, от задачи - к достижимым промежуточным состояниям [АШп-зоп R. и АЙЙП80П Т. G., 5ткп, Вет, 1993].
Общепризнанным феноменом является мало осознаваемый характер экспертного умения, состоящий в том, что хотя эксперты без ошибок и устойчиво демонстрируют свое умение принимать решения в процессе профессиональной деятельности, они не всегда могут объяснить, как это делают и какими правилами при этом руководствуются [КлпЫгот, 1987;№5Ъеи,\М1<юп, 1977]. Психологические исследования показывают, что такие правила не осознаются, более того, их неосознаваемое^ носит фундаментальный характер [ЬегосИ, НШ, Спешка,
Компьютерная психодиагностика
1992]. Люди далеко не всегда осознают правила принятия решений играя в шахматы, формируя впечатления о других людях, в процессе творческого мышления, а также при формировании и распознавании образов, в особенности - невербализуемых.
Даже прямые подсказки не позволяют получить от экспертов правдоподобные объяснения. Так, например, в литературе описан эксперимент, в котором испытуемые вырабатывали умение быстро обнаруживать цифры, используя подсказки, спрятанные в условиях задач. Этот эксперимент был организован так, что испытуемому на экране компьютера предъявлялись таблицы с числами, за пределами которых в разных местах экрана появлялась отдельная цифра, а от испытуемого требовалось совместить метку, управляемую мышью, с этой цифрой. Определенное расположение цифр в таблице было подсказкой, указывающей на то, в каком месте экрана появится цифра. Объективная характеристика (время решения) показала, что испытуемые использовали эти подсказки, но они были неспособны не только указать на них, но даже установить факт их существования [1лпЕ, Маппоу, 1994].
Феномен неосознаваемое™ экспертных умений может быть описан в терминах эксплицитной и имплицитной памяти.
Эксплицитная память - это термин, обычно описывающий знание, которое человек может сознательно вспомнить, в противоположность имплицитной памяти, проявляющейся в том, что он лучше выполняет какую-либо задачу.
Примером может служить запоминание клавиатуры печатной машинки (или компьютера). Многие квалифицированные машинистки не могут вспомнить порядок клавиш, не вообразив себя печатающими. Очевидно, что их пальцы знают, где находятся клавиши, но они просто не имеют сознательного доступа к этому знанию. Если попросить машинистку сообщить, где находятся клавиши (их порядок), то можно сделать вывод о том, что она совершенно не знает клавиатуры. Если проверить, как она печатает, то можно сделать вывод о том, что она знает клавиатуру в совершенстве. ,
Различие между эксплицитной и имплицитной памятью называют диссоциацией. Эксперимент, проведенный Берри и Бродбентом в 1984 году [Андерсон, 2002], прекрасно иллюстрирует эти понятия. В качестве испытуемых были студенты Оксфордского университета. Они должны были контролировать производительность гипотетической сахарной фабрики, которая была смоделирована с помощью компьютерной программы. Испытуемые видели производительность (число) и должны были менять количество работающих. В таблице 3.2 показаны некоторые взаимосвязи в работе гипотетической сахарной фабрики.
Глава 3. Конструирование компьютерных психодиагностических методик
Таблица 3.2
' Численность работающих | Производительность сахара (т) |
10 000 | |
12 000 | |
13 000 | |
Цель состояла в том, чтобы удерживать производство сахара в границах от 8000 тонн до 10 000 тонн.
Можно было попробовать вывести правило, связывающее производство сахара с занятой рабочей силой. Но эта связь не очевидна. Производство сахара в тысячах (С) было связано с количеством рабочей силы в сотнях (Р) и производством сахара в предыдущий месяц в тысячах (С1) следующей формулой: С = 2Р-С1.
Испытуемым давалось 60 попыток, чтобы научиться управлять фабрикой. После 60 попыток они хорошо научились управлять производством сахара, однако не могли сформулировать правило, которым они при этом руководствовались, и заявляли, что они давали ответы на основе «некоторой интуиции» или потому, что это «казалось правильным».
Таким образом, испытуемые были способны приобрести имплицитное знание того, как руководить такой фабрикой, не сообщая об эксплицитном знании. На основании этого можно сделать вывод о том, что испытуемые могут эффективно осваивать процедуры для выполнения задач без какой-либо способности объяснить, что они делают.
Изнеосознаваемогохарактераэкспертныхзнанийследуетневозмож-ность их выявления путем прямого опроса экспертов. Эксперты могут сообщить факты, передать знание, содержащееся в книгах, решать задачи классификации, но неспособны вербализовать свое умение.
В одной из работ исследовались процессы передачи знаний между учеными и было сделано заключение, что часть знания вообще невозможно воспринять от эксперта не только потому, что он не может его выразить, но и вследствие того факта, что он не осознает его важность
Компьютерная психодиагностика
в своей деятельности [СоНии, 1985]. О неправильной оценке экспертом важности тех или иных своих знаний для решения задач пишут и другие авторы [Гельфанд и др., 1988]
При длительном наблюдении за процессом решения задач экспертами можно обнаружить, что они систематически обращают внимание на определенную информацию, о которой не сообщают ничего Иными словами, самые компетентные эксперты оказываются некомпетентными при попытке описать знания, которые они используют при выработке решений. Этот эффект известен психологам и в литературе по когнитивной психологии отмечен как феномен слабой корреляции между вербальными сообщениями и ментальным поведением эксперта [Осипов, 1993]. В работе по исследованию восприятия устного изложения также отмечено отсутствие корреляции между вербальными сообщениями и ментальным поведением. Там же указывается, что многие психологи глубоко чувствуют несостоятельность словесной информации [ВатЪгМве, 1979].
Психологические исследования применения теоретических знаний на практике, исследования мышления при решении практических задач показывают, что специфика практического мышления заключается в направленности на преобразования [Корнилов, 1997]. Познание в теоретическом мышлении направлено на объяснение действительности, его интересуют собственные свойства элементов окружающего мира. Поэтому для теоретического мышления характерна созерцательная позиция, стремление абстрагироваться от условий и средств получения или реализации этих знаний. Познание в практическом мышлении направлено на преобразование, оно ищет возможности внесения изменений в те или иные элементы окружающего мира. Его объектами являются не собственные параметры или свойства элементов действительности, а параметры и свойства, изменяющиеся и приобретающие под влиянием действия нужные, задуманные черты.
Субъект практического мышления познает не свойства некоторого объекта, как это происходит в случае с теоретическим мышлением, а свойства взаимодействующей системы, в которую входят 1) этот объект, 2) сам действующий субъект, 3) параметры (условия и средства) действия. По словам Ю. К. Корнилова (1997), этим объясняется, почему накапливаемые знания (опыт) индивидуализированы и почти не осознаются.
О том, что практическое мышление плохо поддается вербализации и во много субъектом не осознается, писал и Л. Секей: «Существует некоторое «исходное знание», непосредственно не обнаруживаемое в процессе мышления, но влияющее на него. ...Превращения и транс-
Глава 3. Конструирование компьютерных психодиагностических методик
формации этого исходного знания... не могут быть обнаружены интроспективно» [Секей, 1965. С. 349-350].
R. К. \Уаёпег и R. У 51егпЬегё (1986) тоже описывают один из вариантов этого явления, называя его «молчаливым», или «подразумеваемым», знанием (1ас« кпо*1ес1ёе), следующим образом: «Практически разумное поведение в различных профессиях, включая менеджмент, частично зависит от «молчаливого знания», которое мы разделили на три категории: знание об управлении собой, другими и карьерой» [Шёпег,51егпЪегЕ,1986.С.59].
Как отмечает Ю. К. Корнилов (1997), «молчаливое» знание плохо вербализуется прежде всего потому, что субъект использует его для построения своих действий, а не коммуникаций. В тех же случаях, когда осуществляется попытка обмена опытом, профессионал с трудом называет лишь единичные свойства объекта, отражая в их названиях цели осуществляемыхдействий, преобразований. Другие компоненты знания еще хуже поддаются вербализации. Субъект обычно лишь «имеет ввиду»,предполагает«известныевсем»условиясовершениядействия, но вовсе не осознает свои средства.
Общепризнанным фактом является то, что принятие решений происходит в так называемой кратковременной памяти человека, объем которой ограничен «магическим» числом 7±2 чанка [Миллер, 1964; Зшоп, 1974]. Под чанком подразумевается единичный информационный факт, или кластер, которым оперирует человек. Ограничение объема кратковременной памяти оказывает существенное влияние на систему переработки информации человеком, заставляя людей вырабатывать чанки все более емкого и обобщенного характера [Грановская, 1974].
В работах по исследованию способов принятия решений шахматистами-экспертами и шахматистами-новичками [Оше, 8шюп, 1973] отмечалось, что в базовом знании экспертов можно выделить чанки, а в базовом знании новичков они отсутствуют.
Г. Саймон считает, что система обработки информации человеком работает в основном последовательно во времени: она способна перерабатывать одновременно лишь несколько символов, причем обрабатываемые символы должны храниться в особых, ограниченных по емкости структурах памяти (чанках), содержание которых может быстро меняться. Поэтому то, что выглядит для наблюдателя как классификация объектов на большое число классов, представляет собой в действительности совокупность классификаций на два-три (обобщенных) класса. Эти выводы находят свое подтверждение в экспериментах Г. Саймона [Шсптап, ЗКиеток!, 81тоn, 1995] по изучению системы
Компьютерная психодиагностика
организации памяти эксперта-мнемониста, запоминавшего большое количество цифр. Как показал анализ, эксперт использовал иерархическую систему хранения информации. Вообще, использование иерархических схем является одним из приемов, позволяющих избежать чрезмерной нагрузки на кратковременную память при запоминании хранении и воспроизведении информации, а также при принятии р^ шений.
Ограниченный объем кратковременной памяти заставляет эксперта использовать при классификации те значения диагностических признаков, которые наиболее характерны для одновременно рассматриваемых двух-трех классов решений. Некоторые авторы, например, отмечают, что врачи-эксперты при дифференциальной классификации часто используют только два значения диагностических признаков (два класса решений) [Ьегшеих, Вог^е, 1992].
Интересны выводы о том, что способность к кратковременному запоминанию оказывается не органической функцией возраста человека, а, скорее, функцией его знаний [ЗсЬпеИег, 1993]. Так, например, вобласти шахмат объем кратковременной памяти детей-экспертов превосходит объем кратковременной памяти взрослых-новичков.
В последние годы публикуются результаты психологических исследований, показывающие, что многие достаточно распространенные способы получения информации от человека (назначения весов признаков, назначение вероятностей и т. д.) являются некорректными: они ведут к противоречиям, смещениям, ошибкам [Туегеку, Капетап 1974; Ларичев, Моргоев, 1991]. В литературе обсуждаются пути преодоления этих трудностей. Так, например, поскольку эксперты часто не могут количественно оценить степень своей уверенности в том или ином утверждении (факте), им предлагают указать порядок их предпочтения [СЫеаих, Eюк, Воиспоп-Меишег, Кгетоу*сп, 1998].
Поведение человека при решении задачи классификации исследовалось в серии психологических экспериментов [Ьалспеу, Мозпкоуюп, КеЬпк, 1988]. Результаты экспериментов показывают, что люди ведут себя достаточно надежно и непротиворечиво при определенных значениях таких параметров, как количество аспектов, число возможных решений для каждого из них и количество классов решений. Если значения этих параметров увеличиваются и переходят определенную границу, то количество ошибок при решении человеком задачи классификации резко возрастает.
Результаты ряда психологических исследований позволяют охарактеризовать систему хранения и переработки информации у эксперта следующим образом [Ларичев, Моргоев, 1991]. Прежде всего, хороший эк-
Глава 3. Конструирование компьютерных психодиагностических методик
сперт обладает знанием тысяч конкретных ситуаций, которые хранятся вегодолговременнойпамяти. Есть данные, что это число достигает 30-50 тысяч [51тоn, 1978]. Каждая из этих ситуаций описывается на привычном для эксперта профессиональном языке. Умение гибко использовать эти ситуации при решении конкретной задачи, вероятнее всего, имеет во многом неосознаваемый характер [КШйгшп, 1987]. Все вспомогательные операции по извлечению и переработке информации совершаются в кратковременной памяти. Ее малый объем служит причиной использования человеком различных эвристических приемов.
Определенное влияние на процесс извлечения знаний оказывает существование так называемого механизма когнитивной защиты эксперта [Осипов, 1993], который принято объяснять с позиций теории индивидуальных психологических конструктов, выдвинутой Дж. Кел-ли в 1955 году в рамках исследований по клинической психологии [Ке11у, 1955]. В соответствии с этой теорией сложность устройства модели мира субъекта определяется набором сформированных его сознанием конструктов, приспосабливаемых к реалиям мира. Конструкт -это особое субъективное средство, сконструированное самим человеком, проверенное им на практике и позволяющее ему воспринимать и пониматьокружающуюдействительность,оцениватьипрогнозировать события. В самом общем виде - это биполярный признак, альтернативные события, противоположные отношения и способы поведения [Петренко, 1988]. Чем шире набор личностных конструктов у субъекта, тем более многомерным, дифференцированным является в его сознании образ мира, себя, других, то есть тем выше его когнитивная сложность. Преодолениемеханизмакогнитивнойзащитысубъектасвя-зывается в этой теории с выявлением множества индивидуальных конструктов и исследованием его структуры.
Кроме изложенных выше психологических аспектов извлечения знаний, существуют еще и лингвистические или, скорее, психолингвистические проблемы, возникающие в процессе извлечения знаний. Взаимодействие инженера по знаниям и эксперта - это прежде всего общение, а общение подразумевает использование языка.
В психолингвистике различают язык, используемый во внутренней речи, и коммуникативный язык, предназначенный непосредственно для общения. Естественный язык, используемый во внутренней речи, в общем случае не тождествен непосредственно коммуникативному языку,аяш1яетсяегомодификацией[Шалютин,1985].Посколысу внутренняя речь есть общение с самим собой, постольку она максимально свернута, минимально избыточна, содержит не полные предложения, а лишь некоторые вехи, по которым движется мысль. Хотя множество
Компьютерная психодиагностика
слов, которые в этом случае используются, относится к лексике обычного языка, грамматический его строй существенно отличается от строя коммуникативной речи. С точки зрения обычной грамматики во внутренней речи происходят нарушения правил и норм языка.
Достижения лингвистики и психолингвистики последнего времени показывают, что языковая форма мысли от момента ее зарождения и до внешнего выражения претерпевает ряд модификаций, выражающих различные фазы порождения речи. Американский лингвист 3. Харрис высказал мысль, позднее детально разработанную Н. Хомским (1962) в концепции порождающих грамматик, о том, что синтаксическая система языка содержит исходную подсистему, по отношению к которой все другие подсистемы являются производными. Эта подсистема включает ограниченное множество синтаксических типов «ядерных предложений». С точки зрения Хомского, любое правильное предложение языка можетбытьполученоиз таких предложений посредством конечного множества трансформационных правил, то есть правил преобразования «ядерных» структур в произносимые и понимаемые предложения.
Ряд психологов считают операции трансформирования «ядерных предложений» в более сложные реальным психологическим процессом, что подтверждается психологическими экспериментами [Шалю-тин, 1985]. Таким образом, чем дальше от внешнего выражения находится мысль, тем в меньшей степени в ее языковой оболочке используется богатство форм естественного языка.
Косвенными доказательствами существования «ядерных» структур, связанных со структурой мысли более тесно, чем формы коммуникативной речи, служат данные исторической грамматики, генетической психологии, а также патопсихологии. Структуры более сложные, чем <<ядерные»,позднеевозникаютвисторическомразвитииязыковирань-ше разрушаются при ряде расстройств речи [Шалютин, 1985].
Осущественныхразличияхмеждукоммуникативнымязыкомиязы-ком мыслительного процесса говорит и то, что люди обычно запоминают и вспоминают не словесное выражение, а содержание мыслей. Как правило, человек выражает усвоенную им мысль в новой словесной оболочке.
Как отмечалЛ. С. Выготский (1956), внутренняя речь характеризуется спрессованностью содержаний, предикативностью и сокращен-ностью фонетических элементов. «Речь без слов», по Л. С. Выготскому, - это предел, из которого исходят языковые формы мысли.
Наличие доречевых форм мышления связывается рядом авторов с функционированием подсознательного [Шалютин, 1985]. В этой сфере преобладает континуальный тип мышления, противостоящий дис-
Глава 3. Конструирование компьютерных психодиагностических методик
кретности языка. Языковая система подсознательных фрагментов мыслительного процесса характеризуется значительно более высоким уровнем расплывчатости элементов и связей, которые эту систему образу-к,т. Движение к речевому выражению мысли представляет собой процесс нарастающей «дискретизации». Следовательно, выражение знания в словах не полностью и не совсем адекватно отражает внутреннее богатство знания, которым оперирует субъект. Поэтому индивид, воспринимающий высказывание, не имеет в прямой форме в тексте полностью мыслей говорящего. Лингвистическое понимание текста и высказываний еще не гарантирует адекватной интерпретации его смысла. Тем самым в процессе общения инженера по знаниям с экспертом происходит существенная потеря информации.
Подведем некоторые итоги. Приведенный выше обзор психологических исследований позволяет отметить
ряд эффектов и[и явлений, наблюдаемых при работе с экспертами и о:азывающих существенное влияние на процесс п.влечения знаний. К ним относятся:
□ существованиетакназываемых«молчаливых»,или подразумеваемых, знаний (иск кшотксДО, обусловленное тремя причинами: неосознаваемым характером экспертного умения, трудностью процесса вербализации и недооценкой экспертом важности некоторых знаний, используемых при решении профессиональных задач;
□ особая форма организации знаний экспертов по сравнению с организацией знаний новичков;
□ достаточно высокая скорость решения экспертом профессиональных задач;
□ ограниченность объема кратковременной памяти человека;
□ некорректность некоторых способов получения информации (присвоение весов признаков, присвоение вероятностей и т. д.);
□ существование механизма когнитивной защиты;
□ наличие психолингвистических проблем, в частности, тот факт, что различие между коммуникативным языком и языком мыслительного процесса приводит в ходе общения инженера по знаниям с экспертом к значительной потере информации.
Компьютерная психодиагностика
Вот почему процесс извлечения экспертных знаний традиционно считается «узким местом», а преодоление описанных выше проблем является актуальной задачей для создания систем, основанных на знаниях
В связи с этим в рамках инженерии знаний (и в теоретическом плане, и в результате практических разработок конкретных систем) создаются так называемые методы извлечения знаний (кпо«1ес1Ее еИскаиоп 1есЬтЧие5), представляющие собой некоторую процедуру или форму взаимодействия инженера по знаниям с экспертом.
Описание «ручных» (неавтоматизированных) методов, компьютерных методов, а также так называемых систем извлечения знаний содержится во многих работах [Gaттаск, Уоищ, 1984; HаП, 1986; Волков, Ломнев, 1989; Воозе, 1989; Гаврилова, Червинская, 1992].
Одни техники опираются на теоретические основы и являются частью методологии процесса построения интеллектуальных систем, другие носят характер эвристических приемов и рецептов, основываются на здравом смысле, эмпирическом опыте или психологических исследованиях и не предполагают определенной методологии разработки интеллектуальных систем. Одна часть методов создавалась в рамках такихнаучныхдисциплин, как психологическая диагностика, системный анализ, принятие решений, анализ данных, и впоследствии была «взята на вооружение» в инженерии знаний, другая специально разрабатывалась для поддержки извлечения знаний.
Существуют разные классификации методов извлечения знаний [Ьер1а1, 1986; Oкоп, Кие*ег, 1987; Волков, Ломнев, 1989; Гаврилова, Червинская, 1992; Осипов, 1993].
Методы извлечения экспертных знаний имеют прямую аналогию с методами психологической диагностики. В обоих случаях необходимо получить от человека некоторую информацию, касающуюся содержания его интеллектуальной деятельности и личностных отношений (что и составляет ядро профессионального опыта), в том числе и ту, что самим человеком не осознается.
В соответствии с этим методы извлечения знаний можно разделить на неэкспериментальные и экспериментальные. Неэкспериментальные методы предполагают свободную форму взаимодействия инженера по знаниям с экспертом, не имеющую строгой процедурной регламентированности, жестко заданной структуры действий и воспроизводимости, характерных для эксперимента. Экспериментальные методы предполагают активную деятельность инженера по знаниям (как экспериментатора) по созданию определенных регламентированных условий (например, стандартизованного стимульного материала), предъявлению этих условий эксперту с последующим формализованно
Глава 3. Конструирование компьютерных психодиагностических методик
ным анализом полученных результатов. Главная особенность экспериментальных методов состоит в воспроизводимости процедуры и условий эксперимента для получения релевантной поставленным задачам информации.
К неэкспериментальным методам в инженерии знаний относятся клинико-психологические методы медицинской психодиагностики [Червинская, Щелкова, 2002] а именно:
□ беседа (или диалог);
□ наблюдение;
□ неструктурированное интервью;
□ анализ продуктов деятельности.
Учитывая специфику инженерии знаний, к неэкспериментальным методам извлечения знаний можно добавить:
□ лекции;
□ мозговой штурм;
□ круглый стол.
, Индивидуальные