Системы обработки естественного языка
Междисциплинарное прикладное направление с несколько неудачным названием «обработка естественного языка» (перевод английского термина Natural Language Processing) возникло в конце 60-х гг. и развивалось в рамках научно-технологической дисциплины «искусственный интеллект». По своей внутренней форме словосочетание «обработка естественного языка» охватывает все области, в которых компьютеры используются для обработки языковых данных. Между тем в практике закрепилось более узкое понимание этого термина — разработка методов, технологий и конкретных систем, обеспечивающих общение человека с ЭВМ на естественном или ограниченном естественном языке.
Возникновение и бурное развитие этого направления в 70-е гг., рассматриваемого в прикладной лингвистике как часть проблематики компьютерной лингвистики, связано в первую очередь с неожиданным экспоненциальным ростом количества конечных пользователей ЭВМ. Поскольку обучение языкам и технологии программирования всех пользователей невозможно[22], то возникла проблема организации взаимодействия с компьютерными программами. Решение этой проблемы коммуникации шло по двум основным путям. В первом случае предпринимались попытки адаптации языков программирования и операционных систем к конечному пользователю. Языки низкого уровня типа Ассемблера заменялись языками высокого уровня типа Visual Basic; происходило развитие
операционных систем в сторону большей изобразительности и наглядности; для создания коммуникативного комфорта и облегчения понимания в операционных системах стали использоваться привычные человеку метафоры ПИСЬМЕННОГО СТОЛА, БИБЛИОТЕКИ. Эта тенденция в настоящее время в явной форме отразилась в дизайне и организации интерфейса в операционных средах корпорации «Microsoft Windows», но еще раньше (как минимум, на десятилетие!) аналогичная идеология приближения к конечному пользователю была реализована в операционных системах компьютеров фирмы «Apple-Macintosh».
Второе направление — разработка систем, которые позволяли бы взаимодействовать с ЭВМ в конкретной проблемной области на естественном языке или каком-то его ограниченном варианте. В центре внимания исследований в области обработки естественного языка оказался опыт изучения общения, диалога, коммуникации в гуманитарных науках. Основное отличие компьютерного моделирования коммуникации в системах взаимодействия с ЭВМ заключается в том, что при ограничении проблемной сферы разработчикам приходится тем не менее учитывать все аспекты, все уровни реального общения, что представляет собой серьезную проблему не только практического, но и теоретического плана. Достаточно сказать, что до сих пор не существует общепринятой теории диалога на естественном языке, которая включала бы лингвистические, социологические и психологические составляющие.
Базовая структура человеко-машинного взаимодействия.Общение с ЭВМ осуществляется в виде диалога, включающего в обычном случае двух участников — человека и ЭВМ. Роли участников меняются — инициатором может выступать и машина, и человек. Имеются системы, которые настроены только на одну стратегию. Например, информационно-поисковые системы ориентированы, преимущественно, на пассивную стратегию ответа на вопросы, задаваемые пользователем. Перехват инициативы компьютером возможен только для уточнения вопроса или информационной потребности. Такие системы называются системами с жесткой структурой диалога.С другой стороны, многие экспертные системы на определенном этапе должны использовать стратегию опроса пользователя. Если допускается смена ролей участников диалога, такая структура коммуникативного взаимодействия называется мягкой.
Базовые компоненты систем, обеспечивающих взаимодействие с ЭВМ на ЕЯ.Архитектура систем обработки естественного языка в общем случае включает блок анализа речевого сообщения пользователя, блок интерпретации сообщения, блок порождения смысла ответа и блок синтеза поверхностной структуры высказывания. Особой частью системы является диалоговый компонент, в котором фиксированы стратегии ведения диалога, условия применения этих стратегий, способы преодоления возможных коммуникативных неудач.
Диалоговый компонент.Диалоговый компонент системы общения на ЕЯ должен обеспечивать коммуникативное взаимодействие на гло-