Принцип работы современных CAT-программ
- Программа делит исходный текст на сегменты (как правило, это предложения или части предложений), и переводчик вписывает перевод каждого сегмента прямо под исходным текстом или – если текст представлен в виде таблицы – справа от него.
- Перевод сегмента сохраняется вместе с исходным текстом. Записываются также имя переводчика и дата перевода (что важно для командной работы). К сегменту можно вернуться в любой момент, чтобы проверить или изменить перевод.
- Программа помещает сегмент в память переводов, так что если он снова встретится в исходном тексте, его перевод подставится из ТМ автоматически. Кроме того, CAT-программа имеет функцию поиска нечетких соответствий: она обнаруживает сегменты, только частично схожие с уже переведенным (например, совпадающие на 75 %), и дает «подсказки» по их переводу.
Существует четыре основных типа сегментов:
- повторы (repetitions)
- частичные совпадения (fuzzy)
- 100%-е совпадения (100% matches)
- отсутствие совпадений (no matches)
No-matches – это сегменты, перевода которых нет в переводческой базе. Fuzzy – это сегменты, которые похожи на сегменты, переведенные в прошлом и сохраненные в базе. 100% matches – это переведенные и существующие в базе сегменты. Повторы же – это фрагменты, которые неоднократно встречаются в анализируемом тексте. Если в документе содержится пять одинаковых предложений, то в анализе появится один сегмент типа no-match и четыре повтора.
Повторы рассматриваются как 100% совпадения, так как перевод первого такого встреченного предложения (которое затем опять попадается в тексте) сохраняется в переводческой базе. В результате в следующий раз данное предложение переводится автоматически – с использованием перевода, сохраненного в базе.
В процессе перевода система проверяет, не был ли переведен и записан в переводческой базе такой же или похожий сегмент.
Если такой же либо похожий сегмент существует в переводческой базе, программа автоматически подскажет переводчику найденный перевод. Также она покажет, является ли сегмент в переводческой базе:
- идентичным (100% match)
- частичным совпадением (fuzzy match)
- с сегментом, который переводится в настоящий момент.
Многие CAT-программы позволяют подключать к процессу перевода терминологические базы для автоматического поиска и подстановки переводов глоссарных терминов (иногда для этого применяются дополнительные модули или приложения, например Multiterm для Trados).
Современные CAT-программы не только работают с памятью переводов и глоссариями, но и поддерживают модули проверки качества перевода, работу с метаданными (тегами разметки html и других форматов) и выполняют другие полезные функции.
Большинство CAT-программ позволяют проверять орфографию в переводе (либо встроенными средствами, либо подключая модуль проверки правописания Word). Для всех основных CAT-программ существуют модули сопоставления параллельных текстов, которые сегментируют их на фрагменты «оригинал-перевод», автоматически формируя на основе этих фрагментов память переводов.
В форматы, поддерживаемые CAT-программами, можно преобразовать файлы большинства популярных текстовых процессоров и приложений для верстки и публикации (файлы Office, RTF, HTML и др). Для удобства работы почти все CAT-программы позволяют группировать рабочие файлы, базы данных и глоссарии в отдельные проекты.