Формирование системы понятий
Формирование системы понятий подразумевает выделение некоторых единиц смысловой информации, отражающих явления, процессы, факты, объекты и т. д. в исследуемой предметной области. Что счи-
7 Зак 4548 193
Компьютерная психодиагностика
тать единицами смысловой информации, а что нет - это центральный вопрос, наиболее важный и наиболее сложный, решаемый непосредственно разработчиками в процессе проектирования интеллектуальных систем. Как правило, эта проблема разрешается на уровне «здравого смысла» методом проб и ошибок. Тем не менее опыт решения задач в области психодиагностики, а также литературные источники [Кук, Макдональд, 1986] позволяют сформулировать некоторые общие положения по отбору концептов для формирования системы понятий.
1. В литературе указываются свойства, которыми должна обладать полученная система понятий. Это уникальность (отсутствие избыточности), полнота (достаточно широкое охватывание различных процессов, фактов, явлений и т. д. исследуемой предметной области), достоверность (соответствие выделенных единиц смысловой информации их реальным наименованиям) и непротиворечивость (отсутствие омонимии, то есть той ситуации, когда различным единицам смысловой информации приписываются одинаковые наименования).
2. Существуют эксперименты, показывающие, что формирование системы понятий с указанными выше свойствами зависит от того, какими методами она была получена. При применении разных методов состав тезауруса меняется [Кук, Макдональд, 1986].
3. Некоторые элементы (единицы смысловой информации), необходимые для построения модели и, следовательно, претендующие на то, чтобы быть включенными в систему понятий, не всегда могут иметь смысл в реальной предметной области. Эксперт использует их в своей профессиональной деятельности интуитивно, никакне называя (прагматически, в этом не было необходимости). В этом случае следует попросить эксперта присвоить такому элементу имя. Например, при формировании модели интерпретации тестовых данных по опроснику Т. Лири система понятий, по описанным в п. 3.5 причинам, была сформулирована исключительно экспертом.
4. Концепты, отбираемые в систему понятий, должны быть релевантны решаемой задаче. Это означает, что сформированная система понятий отражает не вообще явления, факты, процессы и т. д. исследуемой предметной области, а только те, которые необходимы для решения конкретной задачи.
5. Понятия разной степени обобщенности образуют иерархические системы. В когнитивной психологии есть гипотеза [Хофман, 1986]отом, что в таких системах существует уровень понятий особого типа, с которых как бы начинается понятийная дифференциация объектов. И. Хофман называет такие понятия первичными, Э. Рош - базовыми. Они вос-
Глава 3. Конструирование компьютерных психодиагностических методик
производятся (узнаются, называются) испытуемыми спонтанно, в первую очередь. Скажем, при предъявлении гитары сначала называется понятие «гитара» (первичное), затем понятие «гавайская гитара» (видовое понятие), затем - «музыкальный инструмент» (родовое понятие). Аналогично при предъявлении яблока: яблоко, антоновка, фрукт; при предъявлении молотка: молоток, плотницкий молоток, инструмент; при предъявлении стола: стол, кухонный стол, мебель.
Основная проблема в построении системы понятий (и метапоня-тий, то есть понятий более общего уровня) заключается в сложности выделения первичных, родовых и видовых понятий. В инженерии знаний эта проблема формулируется как «угадывание» начального уровня детализации. В этом случае необходимо решить, что (какое понятие) считать первичным, какое родовым, какое видовым. Для этого в первую очередь определяют уровень детализации (дробления) понятий, который и ложится в основу системы понятий. Будет ли этот уровень состоять из первичных, родовых или видовых понятий - решается в каждой предметной области конкретно.
Выделение различных уровней детализации понятий является наиболее важной задачей, так как эксперту трудно идентифицировать множества рассуждений, компоненты которых не принадлежат одним и тем же уровням. Смешение уровней влечет за собой неадекватность формулируемых знаний и невозможность выработать универсальные решения для задач, оперирующих этими понятиями.
Изложенные ниже методы формирования системы понятий представляют собой определенные задания, которые даются эксперту. Информация, получаемая от эксперта, тщательно анализируется.
Методлокальногопредставления [Тиори, Фрай, 1985]. Эксперта просят осуществить декомпозицию цели, то есть разбить задачу на подзадачи и тем самым выделить некоторые локальные представления.
Далее для каждого локального представления эксперт должен сформулировать информационные факты. В отношении числа таких фактов, используемых в локальном представлении, можно применить правило из теории информации [Миллер, 1964]: «Магическое число семь плюс минус два». Это правило констатирует, что число информационных фактов (информационных кластеров), которыми человек может одновременно управлять, примерно равно семи. Применяя это правило к процессу получения системы понятий, можно сказать, что число информационных фактов в локальном представлении должно быть не более девяти, скорее всего шесть-семь. Если это правило не соблюдается, то возможно, что область применения локального представления
Компьютерная психодиагностика
слишком обширна. Далее каждому информационному факту необходимо дать четкое наименование (название).
Основная проблема, которую нужно решить при использовании этого метода, заключается в следующем. Часто некоторая порция информации может быть представлена разными способами: как атрибут как понятие или как связь. Например, тот факт, что два человека находятся в семейных отношениях, может быть выражен понятием «семья» связью «женат-на» («замужем-за») или атрибутом «супруг(а)». В этом случае можно руководствоваться следующими двумя правилами.
Правило 1.Должнабытьиспользована та конструкция (атрибут, понятие или связь), которая кажется более естественной.
Я^МЛ02Внутрикаждоголокальногопредставлениядолжнабыть использована только одна конструкция.
Метод вычисления коэффициента использования [Т^ж,Фт, 1985]. Этот метод основан на следующей гипотезе: элемент данных (информационный факт, единица смысловой информации и т. д.) может являться понятием, если он
□ используется в большом числе подзадач;
□ используется с большим числом других элементов данных;
□ редко используется совместно с другими элементами данных по сравнению с общим числом его использования во всех подзадачах (это и есть коэффициент использования).
Таким образом, можно заполнить следующую таблицу.
Таблица 3.9
Использование в подзадачах | Использование совместно с другими элементами данных | Коэффициент использования | |
Частое | |||
Среднее | |||
Редкое |
Далее, эти значения могут использоваться в качестве критериев для классификации всех элементов данных и, соответственно, для построения системы понятий.
Метод формирования перечня понятий. Экспертам (желательно, чтобы их было больше двух) дается задание: на листе бумаги составить список понятий, относящихся к исследуемой предметной области. Понятия, выделенные всеми экспертами, включаются в систему понятий, остальные подлежат обсуждению.
Ролевой метод. В эксперименте принимают участие три человека: эксперт и два инженера по знаниям. Эксперту дается задание обучить
^Тяава 3. Конструирование компьютерных психодиагностических методик
инженера по знаниям решению некоторых задач предметной области. Таким образом, эксперт играет роль учителя, инженер по знаниям -роль ученика. Процесс обучения записывается на магнитофон. Затем третий участник, играющий роль стороннего наблюдателя, прослушивает запись и выписывает на бумаге все понятия, употребляемые учителем и учеником.
Составление списка элементарных действий. Эксперту дается задание составить список элементарных операций при решении задачи в произвольном порядке.
Составление оглавления учебника. Эксперту предлагают представить ситуацию, в которой его попросили написать учебник. Необходимо составить на бумаге перечень предполагаемых глав, разделов, параграфов, пунктов и подпунктов книги.
Текстологический метод. Эксперту дается задание выписать из руководств (книг по специальности) некоторые элементы, представляющие собой единицы смысловой информации. Этот метод был использован при построении модели интерпретации результатов тестирования поMMР1.