Глава 4. Оптимизация информационной функции языка. Оптимизация общения с ЭВМ
Оптимизация общения с ЭВМ
бальном уровне (стратегия ведения диалога в зависимости от решаемых задач), на уровне тематической структуры (выбор и отождествление конкретной проблемы), а также на уровне речевых действий (последовательностей речевых актов участников). Степень проработки каждого из этих уровней в конкретных алгоритмах системы может быть различной. Это определяется общими задачами системы ИИ, в которую встроена система диалогового взаимодействия. Стратегии ведения диалога и его тематическая структура обычно представляется в виде сценариев. Сценарии могут вводиться в систему изначально или порождаться ею в зависимости от конкретной задачи. Готовые сценарии используются в тех случаях, когда система ориентирована на узкую проблемную область и требуется значительное быстродействие. По большей части это общение с базами данных, а также задачи устранения коммуникативных неудач. Если готовый сценарий в системе отсутствует, в архитектуре программы предусматривается специальный блок планирования, который формирует сценарий для данной проблемной ситуации, данного диалога. Порождение сценариев предпочтительно для таких систем ИИ, когда полное исчисление типов ситуаций общения изначально предусмотреть невозможно. Такова, например, специфика общения с экспертными системами.
На уровне речевых действий в системах используются разработанные в лингвистике модели диалогового взаимодействия. Центральную роль здесь играет представление о коммуникативном шаге (ходе), вынуждаемом ситуацией или предшествующими коммуникативными ходами. Так, речевой акт вопроса (инициирующий шаг) иллокутивно вынуждает речевой акт ответа (реактивный шаг); речевой акт разрешения вынуждается речевым актом просьбы и т.д.[23] Типичные последовательности иллокутивно связанных реплик фиксируются в диалоговом компоненте и используются системой в планировании коммуникативного поведения на уровне речевых действий.
Блок понимания. Понимание высказываний предполагает два основных этапа — анализ и интерпретация. На этапе анализа происходит морфологический анализ словоформ и синтаксический и семантический анализ предложений. Особенности построения систем поддержки диалога с ЭВМ таковы, что часто граница между синтаксическим и семантическим анализом почти отсутствует. Общая тенденция построения алгоритмов работы программ сводится к тому, чтобы как можно быстрее перейти от поверхностного уровня к уровню глубинной семантики и к уровню концептуальных структур, чтобы компенсировать возможные недостатки или ошибки работы грамматических парсеров (программ грамматического анализа). Достигается это за счет богатой модели мира (детального представления проблемной области в модели мира), позволяющей восстановлять опущенные или неопознанные связи.
Блок порождения высказываний. Порождение высказываний в системах поддержки диалога с ЭВМ предполагает этап синтеза содержания в виде концептуального представления на специальном метаязыке и этап оформления содержания в высказывание. На первом этапе определяется объем информации, которую следует передать пользователю, уровень общности информации; предполагаемое членение информации на «порции», соответствующие предложению; определение последовательности «порций» смысла; выявление частей содержания, соответствующих предполагаемым границам слов; построение семантического представления отдельных предложений. На втором этапе происходит упаковка семантического представления высказывания в синтаксические структуры предложения. Здесь, среди прочих, играют существенную роль категории коммуникативной организации смысла высказывания — тема, рема, данное, новое и др.
Элементы типологии систем, обеспечивающих взаимодействие с ЭВМ на ЕЯ.Среди систем рассматриваемого типа обычно выделяются вопросно-ответные системы, диалоговые системы решения задач и системы обработки связных текстов[24].
Изначально вопросно-ответные системыстали разрабатываться как реакция на плохое качество кодировки запросов при поиске информации в информационно-поисковых системах. Поскольку проблемная область таких систем была сильно ограничена, это несколько упрощало алгоритмы перевода запросов в представление на формальном языке и обратную процедуру преобразования формального представления в ЕЯ-высказывания. Из отечественных разработок к программам такого типа относится система ПОЭТ, созданная коллективом исследователей под руководством Э. В. Попова. Она обрабатывает запросы на русском языке (с небольшими ограничениями) и синтезирует ответ. Блок-схема программы предполагает прохождение всех этапов анализа — морфологический, синтаксический и семантический анализ и соответствующих этапов синтеза. Запросы преобразуются во внутреннее представление системы, которое сопоставляется с данными по проблемной области, после чего синтезируется ответ. Система ПОЭТ может отвечать на вопросы о перевозках грузов — количестве, времени, затратах и пр. В вопросно-ответных системах ЭВМ играет пассивную роль, интерпретируя каждую реплику пользователя как информационный запрос. Пользователь не может задавать вопросы о свойствах системы, о ее структуре. Имеются ограничения и на форму запроса — он должен выражаться только одним речевым актом.
Одна из наиболее сложных проблем разработки вопросно-ответных систем — способы организации данных. В некоторых системах для обработки и хранения данных используются «списочные» языки типа LISP. Они позволяют существенно упростить логику поиска и приблизить алгоритмы обработки запроса к алгоритмам обработки базы данных.