Перевод как прикладная лингвистическая дисциплина 171



материал, который вызвал интерес, переводился обычным способом — с участием переводчика. Кроме того, не прекратилось финансирование исследований в сфере МП частными компаниями, заинтересованными не только в отслеживании мировых тенденций научно-технического про­гресса, но и в переводе огромных объемов технической документации, требующемся при экспорте и импорте различной продукции, в том числе и высокотехнологичной.

С середины семидесятых годов во всем мире наблюдается устойчивое возрастание интереса к МП. В Москве в 1974 г. в институте ИНФОРМ-ЭЛЕКТРО начались работы по созданию системы франко-русского пере­вода (ЭТАП-1) и системы англо-русского перевода (ЭТАП-2). В этом же году создается Всесоюзный центр переводов (ВЦП), в котором ряд науч­ных коллективов работает над системами машинного перевода — АМПАР (англо-русский перевод), НЕРПА (немецко-русский перевод) и ФРАП (французско-русский перевод). С этого времени промышленные системы машинного перевода разрабатываются и широко используются в США, Европе и Японии.

1.4.2. Машинный перевод: элементы периодизации стратегий. Первые си­стемы МП характеризуются стратегией «прямого перевода».Сущность этого подхода к построению МП заключается в том, что исходный текст на языке L1 (= «входной язык») постепенно через ряд этапов преобразует­ся в текст языка L2 (= «выходной язык»). Преобразования сводятся к тому, что слово (словосочетание) на входном языке заменяется на его словар­ный эквивалент на выходном языке. Понятно, что в системах первого поколения, использующих стратегию прямого перевода, нет необходи­мости моделировать функционирование языковой системы в целом. Для работы таких систем оказывается вполне достаточно правил словарных соответствий. В редких случаях проводится анализ контекста для пере­вода неоднословных выражений, опять-таки представленных в словаре системы. Важно иметь в виду, что стратегия прямого перевода не дела­ет различий между пониманием (анализом) и синтезом (порождением), поскольку они фактически исключены из преобразований по правилам словарных соответствий. Прямой перевод всегда привязан к конкретной паре языков. Например, неоднозначность выражений входного языка разрешается только в той степени, в которой это оказывается необхо­димым для выходного языка. Стратегия прямого перевода в принципе неприменима для проектирования систем МП на более, чем один язык. По временным рамкам системы первого поколения в основном созда­вались в период с конца 40-х до середины 60-х гг. Один из типичных примеров системы такого типа — разбираемая ниже программа GAT.

Существенная модификация стратегии «прямого перевода» обнару­живается в системах с «трансфером» — этапом межъязыковых операций, не сводимых только к замене лексем входного языка на словарные со­ответствия выходного языка. Наличие этапа трансфера предполагает по­строение «промежуточного» или «внутреннего» представления, которое

далее «приспосабливается» к структуре предложения выходного языка. В отличие от первой стратегии, в архитектуре систем МП с трансфе­ром анализ (понимание) и синтез существуют как особые процедуры и обслуживаются различными алгоритмами. В некотором смысле систе­мы с трансфером оказываются промежуточным звеном между стратегией прямого перевода и последующей стратегией языка-посредника (см. ниже систему TAUM).

Критика стратегии прямого перевода привела к созданию «стра­тегии перевода через язык-посредник»или «стратегии языка-посредника».Главная особенность этой стратегии заключаются в том, что между струк­турами входного языка и структурами выходного языка находится один или несколько промежуточных языков, на которые по соответствующим правилам последовательно «переписываются» выражения языка L1[13]. Анализ и синтез при использовании языка-посредника принципиально разделяются. Анализ ведется в категориях входного языка, а синтез — в категориях выходного. В качестве языка (языков)-посредников могут выступать языки представления синтаксической и семантико-синтакси-ческой структуры, чисто семантические языки, языки глубинной семан­тики, приближающиеся к концептуальному представлению в категориях теории знаний (фреймов, сценариев, планов). Системы машинного пе­ревода, основанные на знаниях (knowledge-based systems), возникшие в 80-х гг., рассматриваются как часть систем искусственного интеллекта.

Достаточно условно эта стратегия соответствует второму поколению систем МП с тем уточнением, что системы второго поколения исполь­зуют почти исключительно синтаксические и семантико-синтаксические языки-посредники (см. ниже систему СЕТА).

Последовательное проведение идеи языка-посредника привело к воз­никновению стратегии «универсального семантического языка»,независи­мого от конкретного входного и выходного языка. Преимущества такой стратегии очевидны. Однако современное состояние семантической те­ории не оставляет надежд на успешную реализацию этой стратегии в ближайшем будущем. Таким образом, системы МП третьего поколения остаются в настоящее время весьма отдаленной перспективой.

Как компенсация проблем, возникших со стратегией универсально­го семантического языка, развивается несколько промежуточных стра­тегий, позволяющих существенно улучшить параметры промышленных систем МП. Стратегия «сужения проблемной области»предлагает разра­ботчикам МП ориентироваться на узкие тематические сферы текстов. Это позволяет существенно облегчить словарь системы МП и ограничиться только теми особенностями устройства языковой системы, которые ре­ально представлены в данном подъязыке. Эта стратегия универсальна

Наши рекомендации