Висновки до третього розділу. Виходячи з результатів аналізу перекладів програмами-перекладачами GoogleTranslate і Pragma 5, можна стверджувати
Виходячи з результатів аналізу перекладів програмами-перекладачами GoogleTranslate і Pragma 5, можна стверджувати, що сучасні СМП не в змозі досягти семантико-синтаксичної адекватності і перекладачу для редагування перекладу в обов’язковому порядку треба звертатися до оригінального тексту. Первісна проблема досягнення семантико-синтаксичної адекватності машинного перекладу полягає в нездатності людства на даному етапі розвитку створити ІС з вищим рівнем розуміння. В першу чергу це обумовлено тим, що ще ніхто не зміг пояснити механізмів обробки та структуру зберігання інформації в людському мозку. Адже РР ІС залежить, як ми визначили, саме від даних і алгоритмів, які використовуються системою. Думають лише те, що мозок здатний зберігати таку кількість інформації, яка не може вмістити ні один пристрій зберігання інформації, створений людиною.
Хоча, все ще є можливість поліпшення якості перекладу. На наш погляд, воно полягає в підвищенні рівня розуміння СМП. Наприклад, при РР2, СМП могла б використати отриману інформацію для покращення якості перекладу за рахунок застосування отриманої з усього тексту інформації, що має знизити кількість помилок на рівнях від лексико-семантичного до синтаксичного. Наприклад, це допомогло б правильно перекладати займенники. При підвищенні РР до 3, СМП могла б автоматично вибирати потрібні для перекладу словники, що забезпечило б правильність перекладу спеціальних термінів у більшості випадків.
РР4, коли ІС розуміє ще більше, можливо, дозволило б не тільки адекватно перекладати більшість правильно розпізнаних системою речень, але й навіть виправляти деякі помилки, що містяться в тексті.
У наш час машинний переклад залишається засобом, що допомагає розуміти користувачеві лише деяку частину інформації, що міститься в оригіналі тексту. Також ефективно СМП використовуються в якості помічника перекладачеві. Наприклад, доктор філологічних наук А. В. Ачкасов, завідувач лабораторією письмового перекладу вважає, що «автоматичні перекладачі - серйозна допомога в роботі професійних перекладачів і незамінний інструмент для тих, хто, не знаючи мови, хоче швидко отримати загальне уявлення про зміст тексту (документа, листи, описи приладу)». [17] СМП, здатна перекладати тексти подібно професійному перекладачеві - це поки що ще не втілена в реальність ідея.
Загальні висновки
У період глобалізації суспільства в iнформацiйнiй практиці сформувалася очевидна проблема збільшення попиту на переклад науково-технічної, комерційної, ділової iнформацiї. Вiдповiддю на соціальний запит подолання мовного бар’єру було утворення в промислово розвинених країнах iндустрiї машинного перекладу.
В основі підходу до вирішення проблематики машинного перекладу має лежати певна класифiкацiя систем МП. Щодо участі у процесі перекладу та обсягу роботи системи МП поділяються на автоматизовані та автоматичні. В автоматизованих системах МП людина є обов’язковим учасником процесу перекладу, в той час як в автоматичних системах машина здійснює аналіз тексту оригіналу та синтез тексту перекладу, і сама робить переклад, який може бути використаний у вигляді iнформацiйного документу, котрий в деякій мiрi може замінити оригінал. Вiдповiдно до кiлькості мов, що їх “розуміє” система, розрізняють двомовні та багатомовні системи. У залежності від підходу, на основі якого виконується машинний переклад, СМП поділяються на статистичні (statistic) та традиційні системи,які ґрунтуються на використанні лінгвістичних правил (rule-based). У відповідності до лінгвістичного критерію СМП поділяються на системи, що реалiзують прямий переклад (directtranslation); системи, якi базуються на трансферi (transferapproach); системи з мовою-посередником (interlinguaapproach).
Системи прямого перекладу будуються на використанні великих словників i порівняно простих алгоритмів морфологiчно-синтаксичного аналізу тексту-оригіналу i синтезу текста-перекладу. Ідея трансферу - впровадження в систему блока перетворення структури вхідного тексту у вiдповiдностi з правилами і нормами мови перекладу. Головна ідея систем з мовою-посередником - аналіз змісту тексту та його подання на спецiальнiймовi, яка не залежить від будь-якої природної мови.
На сьогоднішній день найбільш відомими системами, які здатні перекладати тексти з англійської на українську мову є GoogleTranslateBeta компанії Google і СМП Pragma 5.x компанії TridentSoftware. Ядро перекладу Pragma базується на СМП SYSTRAN 5, яка збудована на принципі трансфер-підходу. Головна проблема перекладу - багатозначність слів - вирішена двома способами. Перш за все - спеціальне маркування слів по тематичній спрямованості (близько сотні тематик). По-друге - об'єднання слів у фрази, які мають вищий пріоритет під час перекладу. GoogleTranslate — це сервіс компанії Google, що дозволяє автоматично перекладати слова, фрази та web-сторінки з однієї мови на іншу. Використовується підхід статистичного машинного перекладу, у якому максимальна довжина контексту є 5 слів, а фрази - 6. Вона аналізує великі обсяги тексту (мільярди слів) на різних мовах, а також оригінали та переклади, зроблені професійними лінгвістами. Потім за допомогою спеціальних методик формується модель для перекладу тексту з однієї мови на іншу.
Комунікативний підхід до аналізу адекватності машинного перекладу дозволив дійти наступних висновків.
Функціонально-прагматична адекватність машинного перекладу є змінною категорією і може бути представлена трьома типами:
1. жанрово-тематична адекватність, коли від перекладу вимагається просто отримання знань про жанр тексту-оригіналу та його тематику;
2. адекватність інформативності, де домінантою перекладу є загальний зміст повідомлення, поданого у тексті-оригіналі;
3. семантико-синтаксична адекватність, коли від перекладу потрібна повна і точна передача смислового змісту.
Якість перекладу GoogleTranslate і Pragma 5 приблизно однакова і обидві СМП можуть виконувати переклади із стовідсотковим рівнем жанрово-тематичної адекватності. Щодо адекватності інформативності, наш аналіз помилок показав,що при перекладі програми-перекладачі спотворюють зміст оригіналу на 50 відсотків і отриманий переклад не задовольняє у повній мірі вимоги реципієнта в отриманні релевантної інформації.
Проведений аналіз помилок на рівнях мови із залученням кількісних підрахунків дає змогу зробити висновок, що СМП не в змозі досягти семантико-синтаксичної адекватності і перекладачу для редагування перекладу в обов’язковому порядку треба звертатися до оригінального тексту.
GoogleTranslate частіше підбирає правильні словесні і фразеологічні еквіваленти, хоча в той же час гірше справляється з побудовою граматично правильних речень. Це можна пояснити тим, що в базі даних цієї системи більше відповідностей, але контекст статистичної системи GoogleTranslate становить лише 5 слів, пояснює складність побудови системою граматично правильних речень.
При перекладі довгих речень, якщо GoogleTranslate допустив помилку на початку, він може не допустити помилку в кінці, причому з більшою ймовірністю, ніж Pragma 5, яка в таких випадках спотворює все речення, намагаючись узгодити першу частину з помилкою з другою частиною. При цьому частіше всього помилка переноситься також і на другу частину. Причиною більшості помилок в машинному перекладі є нерозуміння тексту системою МП, так як розуміння вихідного тексту є первинним етапом у процесі перекладу, а, відповідно, й основою правильного викладу його на іншій мові.
Головною причиною “вiдторження” мови машиною є антропоморфізм мови, її повна зорiєнтованiсть на людину i, як наслідок, нерозуміння інформації автоматом, позбавленого “людського чинника”.
Так, ми бачили, що GoogleTranslate має засоби розуміння, що дозволяють в деякій мірі розуміти фразовий рівень мови,тоді як Pragma 5 - синтаксичний. У той же час, виходячи з результатів аналізу, обидві СМП достатньо добре здатні розуміти тільки морфологічний рівень. Таким чином, можна зробити висновок про те, що РР даних СМП дорівнює одиниці.
Якість перекладу поліпшувалася останні 30-40 років в основному за рахунок збільшення швидкості обробки інформації та збільшення обсягів пам'яті, як оперативної, так і для зберігання даних, що дало можливість створювати об'ємні словники і швидше виконувати розроблені алгоритми.
Тоді як багато хто з лінгвістів взагалі сумнівається в можливості створення ідеальної СМП, математики, якіне стикаються з усією складністю процесу перекладу, сповнені оптимізму, і продовжують намагатися створювати все більш складні моделі або покращити існуючі СМП.
СМП задовольняють якусь частину потреби користувачів в перекладі іноземних текстів, що створює потребу в них. В даний час адекватність перекладу СМП - це те, чого хотілося б досягти, але також і те, що не є обов'язковим для того, щоб СМП представляла дійсну матеріальну цінність для суспільства.
Адекватність перекладу сучасними СМП - це скоріше випадковість, ніж показник здатності СМП адекватно перекладати. Первісна проблема досягнення адекватності машинного перекладу полягає в нездатності людства на даному етапі розвитку створити ІС з вищим рівнем розуміння. В першу чергу це обумовлено тим, що ще ніхто не зміг пояснити механізмів обробки і структуру зберігання інформації в людському мозку.