Когда мы говорим об искусственном интеллекте в области переводов, нам представляется «умная машина», которая самостоятельно переводит с одного языка на другой огромные массивы текста, не уставая и не ошибаясь. Именно эту цель ставили перед собой разработчики в середине ХХ века, но уже в XXI веке фокус сместился, и теперь они трудятся не над машиной, способной заменить человека, а над машиной, способной помочь человеку.
Машина и человек: конкуренция или сотрудничество
Еще в
Возможно, именно с тех самых времен переводчики интуитивно опасаются всего, что связано с машинным переводом: большинство из них никогда не признается, что использует его в профессиональной деятельности.
Несмотря на то, что движки машинного перевода сделали огромный шаг вперед по сравнению со своими прототипами, добиться от них идеального качества так и не удалось. Но они стали служить иным целям, о которых мы расскажем ниже.
После неудачных попыток создать идеального «электронного переводчика» разработчики стали работать над новой задачей: не заменить живого человека, а помочь ему. Так появились первые программы автоматизированного перевода — CAT-инструменты.
Главное отличие автоматизированного перевода от машинного — в том, что в его основе лежит технология сохранения и переиспользования выполненных ранее переводов — Translation Memory (TM). Она запоминает часть текста на одном языке и его перевод. Благодаря такому эффективному использованию память переводов повышает скорость работы переводчика и на 40% сокращает затраты на перевод. Кроме баз памяти ТМ также использует цифровые аналоги стандартных ресурсов переводчика — словари и глоссарии, к примеру. Гораздо удобнее искать нужный термин непосредственно в своем рабочем инструменте, чем доставать книгу с полки (или открывать новую вкладку в браузере).
Главной целью использования подобных программ является ускорение процесса перевода и повышение его качества. Под качеством в данном случае мы имеем в виду в том числе сохранение единообразия текста. Никому не хочется, чтобы в переводе один и тот же документ называли то «договор», то «контакт».
Переводчики и облака
Переводческий процесс состоит из множества разных этапов, и непосредственно сам перевод — это лишь небольшая его часть, а переводчик — только один из участников. Но в переводе задействованы и другие специалисты: заказчики, редакторы, менеджеры, и их работа тоже отнимает время.
До недавнего времени этапы переводческого процесса были изолированы друг от друга, и зачастую это приводило к не самым благоприятным результатам. И участники переводческой отрасли пришли к выводу, что в автоматизации нуждается не только перевод, но и все сопряженные с ним процессы.
До 2012 г. все CAT-инструменты были десктопными. Помимо явных неудобств для переводчика — нужно скачивать и устанавливать на компьютер тяжеловесный софт — это доставляло проблемы и менеджерам, работающим с переводчиками. Они отправляли переводчикам файлы и до самого конца не были уверены в том, что получат на выходе. С появлением облачных технологий у менеджеров переводческих агентств появилась возможность наблюдать за работой переводчиков, редакторов и корректоров в онлайн-режиме и в случае необходимости корректировать сроки и качество их работы. Переводчики же выигрывали вдвойне: ночной кошмар любого переводчика — случайная неполадка в компьютере и полное исчезновение уже проделанной работы — ушел в прошлое. Облака гарантировали сохранение всего переведенного текста.
Новому контенту — новые «фичи»
Разумеется, у каждого развития есть предпосылки. Главной причиной стирания границ между этапами переводческого процесса стало изменение качества и количества контента, которому требуется перевод на другой язык.
Во-первых, одновременно с глобализацией бизнеса объемы контента увеличиваются ежегодно. По некоторым прогнозам, чтобы покрыть потребности 90% интернет-пользователей в 2020 г. сайты придется локализовать на 48 языков. Объем контента, которому необходим перевод, с каждым годом удваивается, а переведено и локализовано, согласно исследованиям, всего 0,00000067% всей цифровой информации. Чем больше текстов на перевод, тем лучше должны быть автоматизированы рутинные процессы: отправка и получение файлов, назначение исполнителей и многое другое. Компании, работающие в собственных корпоративных системах, ищут кастомизированные переводческие решения, которые смогут легко встроиться в их бизнес-процессы, и такие решения уже существуют — они гибко интегрируются через API. Таким образом, материалы попадают на платформу автоматически, переводятся, затем готовый перевод возвращается в систему.
Во-вторых, по мере того, как объемы контента увеличиваются, меняются и требования к ним. Конечно, когда заказчику нужно перевести всего две маркетинговые листовки, он будет заинтересован в том, чтобы качество было на высоте.
Но бывают случаи, когда вам нужно перевести не две, а две тысячи листовок. Вы понятия не имеете, что именно написано в них, и нужно для начала просто уловить общий смысл, чтобы принять решение, каким из файлов требуется перевод высшего качества, а каким — нет. И мы вновь возвращаемся к теме машинного перевода, о котором говорили в самом начале, и услуге постредактирования (post-editing): после того, как система переведет текст, его посмотрит профессиональный редактор, который внесет правки и сделает текст читаемым и понятным.
В-третьих, изменилась «динамика» контента. Для примера можно рассмотреть вариант перевода торговой онлайн-площадки вроде AliExpress или eBay. Ежедневно на нее «заливается» сотни мегабайтов нового контента: описание товаров, информация о поставщиках и многое другое (не говоря уже о том, что отзывы покупателей тоже нужно переводить на язык, понятный поставщику). Вручную искать и выгружать новые тексты крайне трудоемко, соответственно, систему будут настраивать таким образом, чтобы она самостоятельно следила за обновлениями и отправляла их на перевод.
Командная работа
Одна из самых важных функций, которые теперь предлагают новые переводческие решения — это возможность работать в команде. CAT трансформируется из переводческого инструмента в целую переводческую экосистему.
Если необходимо перевести большой объем в короткие сроки, единственная возможность сделать это быстро и качественно — разделить документ между несколькими исполнителями. Разделение файла вручную отнимает время как менеджера, который распределяет заказ, так и самих переводчиков. Гораздо удобнее с самого начала назначить специалистов в один проект, создав своего рода переводческую среду, где переводчики, редакторы, корректоры и даже заказчики смогут общаться между собой и советоваться.
Говоря о командной работе, невозможно не упомянуть еще один важный (может быть, самый важный) тренд индустрии — тенденцию к отказу от посреднических услуг бюро переводов и упрощению цепочки. Родилась новая модель маркетплейса, которая позволяет бизнесу взаимодействовать с подрядчиками напрямую. «Умная» система учитывает пожелания клиента и предлагает ему варианты переводчиков, которые отвечают всем критериям заказчика: языковой паре, желательному опыту и цене. При идеальном сценарии вся коммуникация между клиентом и исполнителями происходит через маркетплейс: начиная от подбора специалистов и заканчивая финансовыми расчетами.
Безусловно, для успешной реализации этой модели необходима огромная база данных языковых специалистов со всего мира.
Автор статьи — директор по инновациям ABBYY LS и SmartCAT.