Перевод как прикладная лингвистическая дисциплина 173
для многих сфер прикладной лингвистики — от лексикографии до лингвистического обеспечения информационно-поисковых систем и систем искусственного интеллекта. Стратегия «ограниченного машинного перевода» позволяет включать в технологическую цепочку автоматического перевода человека — на этапе предредактирования, постредактирования или в режиме обработки текста (например, для разрешения синонимии и омонимии).
1.4.3. Машинный перевод: элементы типологии систем. Компьютерные
средства перевода обычно разделяют на три больших группы: систе
мы машинного перевода, системы человеко-машинного перевода (ЧМП)
и терминологические базы/банки данных (ТБД). Системы собственно
машинного перевода не исключают (даже, как правило, предполагают)
участие человека на этапе предредактирования и постредактирования.
В данном случае существенно, что после ввода текста в систему пере
вод осуществляется без вмешательства человека. Используются только
алгоритмы и словари, введенные в ЭВМ.
Системы человеко-машинного перевода, в свою очередь, разделяются на две подгруппы: системы машинного перевода с участием человека и системы человеческого перевода с участием машины. В первом случае компьютерная программа сама осуществляет перевод, однако на определенных этапах она может обратиться к человеку, предложив ему, например, выбрать наиболее подходящее слово для перевода, дать синоним для неизвестного выражения или определить структуру сложной синтаксической конструкции. Наконец, человеческий перевод с участием машины всегда осуществляется в режиме реального времени, причем основную часть работы по переводу берет на себя человек. Переводчик обращается к компьютеру для автоматической обработки отдельных фрагментов текста, для вызова информации из терминологических банков данных (часто удаленных), для автоматического форматирования результирующего текста, проверки орфографии и пунктуации и т. д. Компьютерные системы такого рода иногда называют автоматизированным рабочим местом переводчика.
Терминологические банки данных удобны тем, что они легко модифицируются и позволяют фиксировать самую последнюю словарную информацию по выбранной проблемной области. Часто они используются для создания обычных двуязычных и многоязычных словарей, а также для разработки автоматизированных словарей систем МП. ТБД составляют важную часть рабочего места переводчика.
1.4.4. Основные области использования машинного перевода. Первоначаль-ные иллюзии об универсальности применения МП быстро рассеялись.
Собственно, и спрос на машинный перевод художественных текстов
практически отсутствовал. Между тем область текстов научно-техниче-ской информации настолько велика, что человеческий перевод просто
не в состоянии ее охватить. В службах научно-технической информации
различных ведомств и организаций использование систем МП показало
высокую эффективность. Требования к качеству перевода оказались довольно низкими, что позволило использовать в этой сфере системы МП первого поколения. Вторая сфера применения МП — крупные международные организации, использующие документы на многих языках. К числу таких организаций относится, например, ООН и официальные структуры Европейского Союза, в которых документы должны появляться практически одновременно на всех языках членов ЕС. Однако требования к качеству перевода здесь довольно высоки и этап постредактирования необходим даже для систем МП с хорошими характеристиками.
Третья большая область использования МП — техническая документация. Экспорт продукции — особенно высокотехнологичной — требует перевода больших массивов технических описаний и инструкций. Так, эксплуатационная документация к самолетам достигает 100 и более тыс. страниц. Компании, связанные с экспортом, готовы даже нормировать внутренний язык, используемый для технической документации, чтобы облегчить автоматический перевод этих документов на выходной язык. Например, в Европейской ассоциации авиапроизводителей (European Association of Aerospace Manufactures) под руководством Ван Дейка был разработан специальный стандарт АЕСМА «упрощенного английского языка», налагающий серьезные ограничения на используемую в документации лексику и синтаксические конструкции. Этот стандарт используется, в частности, в корпорации «Боинг» (см. по этому поводу [Wojcik 1997]).
В целом можно сделать вывод, что в настоящее время системы МП успешно функционируют в тех областях, где либо не требуется абсолютная точность перевода, либо существуют существенные ограничения на использование структур естественного языка, где входной язык нормирован и упрощен. К числу проблемных областей последнего типа относится, например, подъязык метеосводок. В Канаде с 1975 г. в промышленном режиме функционирует система МП TAUM-METEO, переводящая тексты метеосводок с английского языка на французский.
1.4.5. Некоторые известные системы машинного перевода. Количество реально работающих и проектируемых систем МП к настоящему времени перевалило за сотню; в некоторых обзорах содержатся описания более, чем семидесяти систем МП [Леонтьева, Шаляпина 1990]. Остановимся на тех программах перевода, которые интересны с точки зрения введенных противопоставлений, характеризующих стратегии МП и типы систем МП.
Система GAT[14]. Одна из первых систем МП, разрабатывавшаяся с 1952 г. в Джорджтаунском университете США. Проблемная область — перевод русскоязычных текстов по физике на английский язык. Стратегия создания — прямой перевод, сопровождавшийся некоторыми синтаксическими перестановками, приближавшими русский порядок слов