Перевод как прикладная лингвистическая дисциплина 171
материал, который вызвал интерес, переводился обычным способом — с участием переводчика. Кроме того, не прекратилось финансирование исследований в сфере МП частными компаниями, заинтересованными не только в отслеживании мировых тенденций научно-технического прогресса, но и в переводе огромных объемов технической документации, требующемся при экспорте и импорте различной продукции, в том числе и высокотехнологичной.
С середины семидесятых годов во всем мире наблюдается устойчивое возрастание интереса к МП. В Москве в 1974 г. в институте ИНФОРМ-ЭЛЕКТРО начались работы по созданию системы франко-русского перевода (ЭТАП-1) и системы англо-русского перевода (ЭТАП-2). В этом же году создается Всесоюзный центр переводов (ВЦП), в котором ряд научных коллективов работает над системами машинного перевода — АМПАР (англо-русский перевод), НЕРПА (немецко-русский перевод) и ФРАП (французско-русский перевод). С этого времени промышленные системы машинного перевода разрабатываются и широко используются в США, Европе и Японии.
1.4.2. Машинный перевод: элементы периодизации стратегий. Первые системы МП характеризуются стратегией «прямого перевода».Сущность этого подхода к построению МП заключается в том, что исходный текст на языке L1 (= «входной язык») постепенно через ряд этапов преобразуется в текст языка L2 (= «выходной язык»). Преобразования сводятся к тому, что слово (словосочетание) на входном языке заменяется на его словарный эквивалент на выходном языке. Понятно, что в системах первого поколения, использующих стратегию прямого перевода, нет необходимости моделировать функционирование языковой системы в целом. Для работы таких систем оказывается вполне достаточно правил словарных соответствий. В редких случаях проводится анализ контекста для перевода неоднословных выражений, опять-таки представленных в словаре системы. Важно иметь в виду, что стратегия прямого перевода не делает различий между пониманием (анализом) и синтезом (порождением), поскольку они фактически исключены из преобразований по правилам словарных соответствий. Прямой перевод всегда привязан к конкретной паре языков. Например, неоднозначность выражений входного языка разрешается только в той степени, в которой это оказывается необходимым для выходного языка. Стратегия прямого перевода в принципе неприменима для проектирования систем МП на более, чем один язык. По временным рамкам системы первого поколения в основном создавались в период с конца 40-х до середины 60-х гг. Один из типичных примеров системы такого типа — разбираемая ниже программа GAT.
Существенная модификация стратегии «прямого перевода» обнаруживается в системах с «трансфером» — этапом межъязыковых операций, не сводимых только к замене лексем входного языка на словарные соответствия выходного языка. Наличие этапа трансфера предполагает построение «промежуточного» или «внутреннего» представления, которое
далее «приспосабливается» к структуре предложения выходного языка. В отличие от первой стратегии, в архитектуре систем МП с трансфером анализ (понимание) и синтез существуют как особые процедуры и обслуживаются различными алгоритмами. В некотором смысле системы с трансфером оказываются промежуточным звеном между стратегией прямого перевода и последующей стратегией языка-посредника (см. ниже систему TAUM).
Критика стратегии прямого перевода привела к созданию «стратегии перевода через язык-посредник»или «стратегии языка-посредника».Главная особенность этой стратегии заключаются в том, что между структурами входного языка и структурами выходного языка находится один или несколько промежуточных языков, на которые по соответствующим правилам последовательно «переписываются» выражения языка L1[13]. Анализ и синтез при использовании языка-посредника принципиально разделяются. Анализ ведется в категориях входного языка, а синтез — в категориях выходного. В качестве языка (языков)-посредников могут выступать языки представления синтаксической и семантико-синтакси-ческой структуры, чисто семантические языки, языки глубинной семантики, приближающиеся к концептуальному представлению в категориях теории знаний (фреймов, сценариев, планов). Системы машинного перевода, основанные на знаниях (knowledge-based systems), возникшие в 80-х гг., рассматриваются как часть систем искусственного интеллекта.
Достаточно условно эта стратегия соответствует второму поколению систем МП с тем уточнением, что системы второго поколения используют почти исключительно синтаксические и семантико-синтаксические языки-посредники (см. ниже систему СЕТА).
Последовательное проведение идеи языка-посредника привело к возникновению стратегии «универсального семантического языка»,независимого от конкретного входного и выходного языка. Преимущества такой стратегии очевидны. Однако современное состояние семантической теории не оставляет надежд на успешную реализацию этой стратегии в ближайшем будущем. Таким образом, системы МП третьего поколения остаются в настоящее время весьма отдаленной перспективой.
Как компенсация проблем, возникших со стратегией универсального семантического языка, развивается несколько промежуточных стратегий, позволяющих существенно улучшить параметры промышленных систем МП. Стратегия «сужения проблемной области»предлагает разработчикам МП ориентироваться на узкие тематические сферы текстов. Это позволяет существенно облегчить словарь системы МП и ограничиться только теми особенностями устройства языковой системы, которые реально представлены в данном подъязыке. Эта стратегия универсальна