Компьютерные переводческие программы
Компьютерный перевод — процесс перевода текстов с одного естественного языка на другой при помощи специальных компьютерных программ. Так же называется направление научных исследований, связанных с построением подобных систем.
Термины «машинный» и «автоматизированный» перевод первоначально соответствовали процессам создания универсальных переводческих программ, однако в ходе развития этой области и осознания проблем, связанных с реализацией данной цели, они обрели совсем другое значение — программа является чисто инструментальной - помогает человеку переводить тексты. Отсюда и новое название данных программ CAT - computer-aided/assisted translation.
Компьютерный перевод предполагает такие формы взаимодействия:
· Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных словарей.
· Системы с разделением труда: компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё не уложившееся в схему отдает человеку.
Компьютерный перевод технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в определенной редакторской корректировке. Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать.
Большинство средств компьютерного перевода построены на основе концепции памяти перевода (translation memory) — простой базы данных, каждая запись которой представляет собой единицу (предложение или абзац) параллельных текстов (как правило, на двух языках). Такая база данных хранит предыдущие переводы с целью их возможного повторного использования и решения задач быстрого поиска по содержимому.
Несмотря на то, что программы, оснащенные памятью перевода, называются системами автоматизированного перевода (CAT, computer-aided/assisted translation), их не следует путать с программами машинного перевода (machine translation) — память перевода ничего не переводит сама по себе, в то время как машинный перевод основан на генерации переводов по результатам грамматического разбора исходного текста.
Примерами таких программ компьютерного переводу могут послужить:
· ABBY Lingvo — семейство электронных словарей. Объём словарных статей составляет более 8,7 млн. В ABBYY Lingvo нет функции полнотекстового перевода, но возможен пословный перевод текстов из буфера обмена. В некоторых словарях на английском, немецком и французском большинство слов озвучены профессиональными дикторами — носителями языка. Помимо существующих 150 профессиональных словарей, результата лексикографической работы сотрудников компании ABBYY и авторитетных бумажных и электронных словарей существует обширная база бесплатных пользовательских словарей для программы. Словари предварительно проверяются и находятся в общем доступе на сайте ассоциации лексикографов Lingvo. [https://ru.wikipedia.org/wiki/ABBYY_Lingvo]
· Trados — система автоматизированного перевода, первоначально (с 1992 года) разработанная немецкой компанией Trados GmbH. Является одним из мировых лидеров в классе систем Translation Memory (TM, Память переводов). Система Trados состоит из модулей, предназначенных для перевода текстов различного формата: документов Microsoft Word, презентаций PowerPoint, текстов в формате HTML и других метаданных, документов FrameMaker, InterLeaf и др., а также для ведения терминологических баз данных (модуль MultiTerm). Концепция Translation Memory предполагает выявление в переводимом тексте фрагментов, переводы которых уже имеются в базе данных переводов, и за счет этого сокращение объёма работы переводчика. Фрагменты, оставшиеся непереведёнными, передаются дальше для ручной обработки переводчику или системе машинного перевода (Machine Translation, MT).
Переводчик на этом этапе может выделить вновь переведённые фрагменты и занести новые пары параллельных текстов на двух языках в базу данных. Такая схема наилучшим образом работает в случае однотипных текстов, где повторяемость словосочетаний достаточно высока, то есть в случае различного рода инструкций для пользователей, технических описаний и т. п. [https://ru.wikipedia.org/wiki/Trados]
На основе новой технологии компания ПРОМТ выпускает линейку программных продуктов PROMT XT:
1. PROMT XT Office — полное решение решение для обработки мультиязычных документов в современном офисе. Стоимость продукта в базовой комплектации составляет 300 долларов.
2. PROMT XT Standard — система для оперативного перевода документов и электронной почты. Стоимость продукта в базовой комплектации составляет 99 долларов.
3. PROMT Internet XT — программа для онлайнового перевода веб-сайтов и поисковых запросов в Интернете. Стоимость продукта в комплектации Premium составляет 49 долларов.
«Выпуск новой линейки продуктов PROMT XT — это большая радость для нас. Нам удалось сделать серьезный рывок в развитии технологии автоматизированного перевода. Новая технология PROMT XT — предмет нашей гордости, является на сегодняшний день абсолютным мировым лидером по качеству перевода» — заявила Светлана Соколова, президент компании ПРОМТ. «На основе новой технологии работают все три продукта новой линейки PROMT XT. Хотелось бы подчеркнуть, что данная линейка продуктов ориентирована на российский рынок. Мы планируем также выпустить всю линейку PROMT XT в иностранной локализации для всех 17 направлений перевода, которые предлагает на сегодняшний день наша компания. Кроме того, в наших ближайших планах — выпуск профессиональной версии PROMT XT Professional и модернизация на основе новой технологии продуктов корпоративной линейки, включая сетевую версию.»
О компании ПРОМТ
Компания ПРОМТ основана в 1991 году. Компания занимается исследованиями в области прикладной лингвистики, разработкой технологий и систем машинного перевода для европейских языков. ПРОМТ ставит своей целью создание программных средств, позволяющих свободно общаться на разных языках. Программные продукты компании распространяются по всему миру под торговыми марками PROMT, REVERSO, PROMT Internet, WebView.
Интернет-решения компании ПРОМТ работают на крупнейших мировых и российских порталах: Lycos (Lycos.ru, Lycos.es, Lycos.de), Voila, Caramail, e-lingo, Transparent Language, InfiniT. Стратегическим партнером компании ПРОМТ является компания Softissimo, SARL (Франция).
Оцените качество перевода на сайте бесплатного переводчика Translate.ru.
Получите скидку в Интернет-магазине компании ПРОМТ: http://www.e-promt.ru/
--------------------------------------------------------------------------------
ПРОДУКТ ПРОИЗВОДИТЕЛЬ ПРИМЕЧАНИЕ
Deja vu Atril Это сравнительно недорогой и самый многофункциональный продукт. Использующие его переводчики подают заявки на включение в него тех или иных полезных функций и эти заявки оперативно выполняются.
Translation Manager IBM По отзывам специалистов, это самая эффективная, хотя и не очень дружественная к пользователю программа.
SDLX SDL Недавно появившийся продукт, который быстро совершенствуется.
Transit Star Лучше других продуктов приспособлен к работе с кириллицей. Немаловажное достоинство — наличие российского дистрибьютора.
Translation’s Workbench Trados В этой программе в качестве служебного редактора используется MS Word. Учитывая так же, что Microsoft приобрела акции компании Trados и планирует использовать ее программное обеспечение в качестве внутреннего хранилища локализованных компонентов, у программы Translation’s Workbench (именуемой в просторечии Trados) есть хорошие шансы стать международным стандартом.
--------------------------------------------------------------------------------
Разумеется, у переводческих накопителей есть и свои недостатки. Помимо уже упоминавшихся ограничений на переводимые тексты, это прежде всего высокая цена большинства TM-продуктов (тысяча и более долларов), а также отсутствие стандарта. Все чаще, приглашая на работу переводчиков, заграничные заказчики оговаривают в качестве обязательного условия наличие у претендента той или иной TM-программы. Однако в объявлениях встречаются разные названия, поэтому, купив продукт, ориентированный на одного работодателя, вы можете не удовлетворять требованиям другого. Причем на овладение каждым из продуктов требуется потратить не только деньги, но и время.
При оценке затрат на эти программы следует учитывать, что переводческие пакеты продаются в виде набора модулей (утилиты создания и ведения базы данных, редактор, фильтры для работы с различными текстовыми процессорами и т.п.), часть из которых могут быть лично вам не нужны. Поэтому нужно внимательно следить за тем, что включено в базовый комплект, а за что вам придется платить отдельно.
Аппаратные аппетиты рассматриваемого класса продуктов вполне предсказуемы (чем всего больше, тем — как всегда — лучше). Причем, кроме всего прочего, TM-продукты предъявляют повышенные требования и к монитору. Поскольку друзья переводчика являются многооконными программами, для работы с ними желательно иметь большой монитор. Специалисты советуют не жалеть день-ги хотя бы на 17-дюймовый.
В мою задачу не входит подробное сравнение продуктов различных фирм — я только хотела обратить внимание читателей на новый пласт программного обеспечения. Те же, кто хотят подробнее ознакомиться со спецификой различных программ, могут посетить сайты ведущих производителей TM-продуктов.
Не могу удержаться и не упомянуть еще один продукт — WordFisher. Его нельзя отнести к категории широко распространенных, и я ни разу не видела, чтобы заказчики требовали его наличия. Однако у этой программы, составленной венгерским переводчиком Тибором Кёрнеи, есть два существенных достоинства: простота и дешевизна. WordFisher является комплектом макрокоманд для перевода документов в MS Word и распространяется как shareware по цене всего 30 долларов.
И последняя «информация к размышлению»:
Опрос, проведенный Международным институтом переводчиков, показал, что пока только около 15% переводчиков используют в своей работе переводческие накопители; однако среди переводчиков с высокими доходами доля пользователей TM-продуктов составляет 40–50%.
НЕДАВНО (см. Результат меняется от перестановки, или Что такое хорошо и что такое плохо?) была опубликована статья Н. Шаховой, посвященная TM-программам, или "накопителям переводчика" (возможно, более удачным является вариант "накопители переводов"), — теме, очень редко затрагиваемой на страницах компьютерных изданий. Продолжая эту тему, предлагаем вам обзор TM-программ, доступных в настоящее время на рынке. Напомним, что речь идет об интерактивных инструментах, позволяющих переводчику накапливать в специальной базе данных (БД) эквивалентные текстовые фрагменты на двух языках, чтобы в дальнейшем быстро находить образцы для перевода новых текстов. В качестве фрагментов могут выступать слова, словосочетания и целые фразы. При работе над текстами, близкими по жанру и тематике, такие инструменты по мере пополнения БД все больше упрощают и ускоряют перевод.
Мастер сопоставления параллельных текстов в DejaVu |
Итак, основные функции TM-программы — пополнение БД парных фрагментов и анализ новых текстов для их поблочного перевода. Программа сегментирует переводимый текст (выделяет фразы или обособленные обороты) и сличает полученные сочетания с элементами БД, в случае совпадения предлагая переводчику подставить готовый перевод фрагмента в конечный текст (или же подставляя его автоматически). Во многих программах предусмотрен "нечеткий" (fuzzy) поиск.
Стандартной для этого класса продуктов стала возможность вести словари терминов и непереводимых имен, что очень важно для работы с текстами из узкой предметной области. Обычно ассортимент поддерживаемых TM-системами языковых пар довольно обширен; в последнее время все большее число разработчиков декларируют поддержку "двунаправленных языков" (bi-directional languages). Термин этот представляется не совсем корректным. Правильнее было бы в данном случае говорить не о языках, а скорее о текстах, содержащих фрагменты на языках с разным направлением письма (например, о смеси английского с арабским или ивритом).
Сама по себе идеология накопителей переводов не подразумевает использования развитых лингвистических технологий, однако в наиболее совершенных TM-программах имеются встроенные морфологические модули и средства проверки орфографии для нескольких языков, а также относительно интеллектуальные средства сопоставления (aligning) параллельных текстов с целью автоматического формирования парных фрагментов на двух языках. Процедуры сопоставления в разных программах различны, но, как правило, они включают элементы диалога и иногда требуют модификации одного из параллельных текстов (особенно если имеет место вольный перевод).
Большинство программ совместимы с популярными текстовыми процессорами и издательскими пакетами, с распространенными форматами типа RTF, PDF и HTML. Почти все TM-системы позволяют для удобства группировать рабочие файлы, БД и терминологические словари в отдельные "проекты".
Накопители переводов — дорогое профессиональное средство. Как правило, разработчики предлагают как корпоративные, сетевые, так и индивидуальные (freelance) версии своих TM-систем. В первом случае (особенно при поставке многофункциональных инструментальных комплексов) цена может превышать 1000 долл., во втором она составляет несколько сот долларов. Программы нередко защищаются с помощью аппаратных ключей.
Панель SDLX обеспечивает удобный доступ ко всем функциям |
Trados 3.0
Одним из пионеров и лидеров рынка TM-программ является многонациональная компания Trados (http://www.trados.com/), предлагающая пакет Trados Translation Solution — линейку инструментов автоматизации перевода. Пакет поставляется в корпоративном (Team Edition) и однопользовательском (Freelance Edition, цена около 1 тыс. долл.) вариантах. Основной модуль пакета, Translator’s Workbench, предназначен для работы с базой данных TM, а также обеспечивает функции преобразования дат и единиц измерения, а при работе со сложными документами — еще и манипуляции со сносками, указателями и т. п. Модуль MultiTerm служит для ведения многоязычной БД терминов. Модуль WinAlign позволяет в полуавтоматическом режиме пополнять БД накопителя путем анализа параллельных текстов на двух языках. Кроме того, в пакет входит средство для перевода документов, содержащих разметку SGML и HTML, — TagEditor.
Версия Trados 3.0 совместима с Windows 2000, Office 2000 (Word 2000, PowerPoint 2000), издательскими пакетами FrameMaker, Interleaf, PageMaker, QuarkXPress и Ventura, языками XML, SGML и HTML. При инсталляции Trados встраивает свой инструментарий в панель инструментов и меню Word. Тесная интеграция с Office позволяет при переводе текстов в Word автоматически пополнять базу данных TM.
Программа автоматически анализирует тексты, разбивая их на сегменты, которые можно затем экспортировать в базу данных TM. Ограничителями сегментов по умолчанию служат табуляторы, маркеры абзацев и некоторые знаки препинания. Сегменты, не имеющие аналогов в БД, можно либо включить туда, снабдив переводом, либо поместить в словарь терминов. После сегментации текста функция автоматизированного перевода предлагает пользователю фрагменты для поблочного формирования перевода.
Инструментарий DejaVu
Компания Atril (http://www.atril.com/) выпускает набор мощных средств класса TM, главным из которых является программа DejaVu Interactive. Ее функция Pretranslate сегментирует исходный текст и автоматически подставляет в конечный переводы сегментов, найденных в БД. Для фрагментов, лишь частично соответствующих имеющимся образцам, функция fuzzy match в диалоговом режиме предлагает вариант перевода. Более интеллектуальные функции Assemble и Propagation позволяют, как утверждается, повысить степень автоматизации перевода и пополнения базы данных TM.
Как и в других TM-системах, в DejaVu есть средство работы с терминами, кроме того, добавлена возможность запрещать перевод отдельных фраз в исходных текстах.
Панель управления WordAlign |
Программа совместима с многочисленными текстовыми редакторами и верстальными программами, в том числе Word, PowerPoint, FrameMaker, PageMaker, QuarkXPress, Interleaf, а также TM-программами IBM и Trados; поддерживаются форматы RTF, Help Contents, Java Properties files, HTML (включая ASP), HTML Help, SGML, RC, C/C++.
DejaVu позволяет в переводческих проектах выбирать языковые пары из обширного списка языков мира; имеется встроенное средство проверки орфографии для десятка европейских языков. В комплект DejaVu входит также модуль TermWatch, который обеспечивает доступ к терминологическому словарю из среды приложений, работающих с иноязычными текстами. Программа снабжена удобным справочником.
Все модули DejaVu используют общий OLE-сервер, на его базе можно разрабатывать приложения, содержащие вызовы функций API.
Цена DejaVu — от 790 до 990 долл. в зависимости от числа приобретаемых лицензий. На Web-узле разработчика можно загрузить бесплатную 30-дневную демоверсию программы.
SDLX 3.0
Компания SDL International (http://www.sdlintl.com/) предлагает TM-инструмент SDLX, позволяющий создавать и редактировать базу данных TM, пополнять ее путем сопоставления параллельных текстов, производить анализ, сегментацию и автоматизированный перевод текстов, вести пользовательский многоязычный глоссарий. Предусмотрен "нечеткий" поиск фрагментов в TM. Поддерживается перевод "двунаправленных" (неоднородных по направлению письма) текстов.
SDLX совместима с форматами документов HTML, RTF, MIF и TXT; предусмотрен импорт и экспорт баз данных TM различных форматов, включая Trados. Важным достоинством программы является возможность обрабатывать (анализировать и переводить) файлы в пакетном режиме.
На узле компании SDL можно загрузить демоверсию SDLX с ограниченной функциональностью. Полная корпоративная версия программы стоит 1000 долл. (она защищается аппаратным ключом), версия Light — 399 долл., версия для одиночных пользователей (без функций анализа текста, автоматического перевода и фильтров для SGML и XML) — 350 долл.
Transit и TermStar
Швейцарская компания STAR (http://www.star-ag.ch/) предлагает серию программ для автоматизации деятельности переводчика.
ТМ-программа Transit Professional использует технологию "нечеткого индекса" (fuzzy index): при поиске фрагментов в базе данных накопленных переводов ищутся сочетания, приблизительно соответствующие выделенному фрагменту.
Transit работает практически со всеми европейскими языками (включая русский), турецким, арабским, китайским и японским, поддерживаются также "двунаправленные" тексты.
Благодаря наличию фильтров импорта-экспорта программа совместима с множеством текстовых процессоров, издательских и прочих пакетов (Excel, PowerPoint, Word, WordPerfect, AmiPro, Interleaf, FrameMaker, PageMaker, Xyvision, Ventura, QuarkXPress), а также с распространенными форматами (HTML, SGML, XML, RTF).
Вместе с Transit распространяется программа TermStar — многоязычный менеджер терминологических гипертекстовых словарей, взаимодействующий с TM-средой и пригодный для многопользовательской работы.
TM-инструменты фирмы STAR поставляются в нескольких вариантах комплектации. Вариант Transit Professional 3.0, включающий TermStar, стоит 1245 евро; вариант Workstation, не имеющий функций импорта и экспорта, — 695 евро. Корпоративный пакет Translation Center Suite стоит около 4 тыс. евро, а его вариант с сетевыми возможностями Corporate Suite 3.0 — около 8 тыс. евро.
WordFisher 4
Независимый переводчик из Венгрии Корней Тибор создал недорогую (всего 30 долл.) TM-программу WordFisher. Программа, реализованная в виде макроса, интегрируется с Microsoft Word (версии 6 и выше) и обладает многими функциями, свойственными профессиональным пакетам этого класса: автоматически создает папку для хранения файлов переводческого проекта, формирует таблицу параллельных фрагментов и позволяет искать в исходном документе текстовые элементы из накопителя TM. Модуль управления глоссариями служит для работы со словарем терминов. Для автоматического построения БД накопителя переводов на основе сопоставления параллельных текстов служит дополнительный макромодуль WordAlign, более простой и быстрый, чем аналогичные средства в составе пакетов Trados, DejaVu и Star.
Полнофункциональную ознакомительную версию WordFisher можно бесплатно загрузить по адресу: http://www.wordfisher.com/wf4.htm