Качество перевода — вещь весьма субъективная. Если дать один и тот же текст нескольким профессиональным переводчикам, то результаты их работы будут различными. И сказать, чей перевод лучше, в большинстве случаев весьма затруднительно. На вкус и цвет товарищей, как известно, нет. В то же время понятно, что, к примеру, перевод технического описания реактивного двигателя лучше поручить специалисту, не только прекрасно владеющему соответствующими языками, но и имеющему хорошее инженерное образование; а перевод результатов МРТ-исследования головного мозга или позвоночника — человеку, сведущему в медицине.
Поэтому неудивительно, что на рынке лучше приживаются не универсальные системы перевода, а ориентированные на ту или иную предметную область. Например, компания PROMT, основанная петербургскими лингвистами в 1991 г., в настоящее время предлагает своим клиентам девять клиент-серверных отраслевых систем машинного перевода, созданных на платформе PROMT Translation Server. Разумеется, есть и базовое клиент-серверное решение для перевода, выполненное на этой платформе. Но на практике оно обычно используется со специализированными словарями.
До середины нынешнего года базовое и все отраслевые решения PROMT были основаны на использовании аналитических (Analytical Machine Translation) и статистических (Statistical MT) технологий машинного перевода. Напомним: первая из них (известная также под названием «перевод на основе правил», Rule-Based Machine Translation, RBMT) появилась в
Но в 2015 г. появилась и стала стремительно развиваться технология машинного перевода, основанная на использовании двунаправленных рекуррентных нейронных сетей (Neural MT). Тому было много предпосылок: сокращение стоимости вычислительных мощностей, необходимых для построения и использования нейросетевых моделей; появление нейросетевых библиотек (в том числе, общедоступных, класса Open Source), реализующих эффективные алгоритмы машинного обучения; создание специализированных аппаратных средств; рост количества текстов (официальных документов, онлайн-публикаций и т. п.), выраженных в различных цифровых форматах и требующих оперативного перевода на те или иные языки; успехи в области применения нейросетевых технологий в разных отраслях и т. д.
Исключительно на базе нейросетевых технологий построен широко известный универсальный общедоступный онлайн-переводчик Google, который в настоящее время позволяет достаточно быстро и гладко переводить слова, предложения и целые страницы текста в 100+ языковых комбинациях. Создавая тем самым серьезную конкуренцию первому в Рунете общедоступному онлайн-переводчику Translate.ru, ведущему свою историю с 1998 г., а ныне поддерживающему свыше 20 наиболее популярных европейских и азиатских языков и охватывающему 88+ языковых пар.
Для полноты картины необходимо добавить, что не специалисты Google придумали технологию нейросетевого машинного перевода. Идеи на этот счет, что называется, давно витали в воздухе. И топ-менеджеры Google, внимательно следящие за инновационными трендами и умеющие держать нос по ветру, в нужное время приобрели правильного стартапа. Cерьезно вложились в него. И в итоге обеспечили себе очень хорошие позиции среди общедоступных онлайн-переводчиков.
Нейросети — это не только плюсы
«Нейросетевые технологии перевода имеют не только преимущества, но и недостатки, — подчеркнул коммерческий директор PROMT Никита Шаблыков, выступая в сентябре на презентации PROMT Neural Translation Server. — Они, в частности, совершенно непредсказуемо, а иногда и очень забавно ведут себя с текстами, содержащими слова, которые не попали в обучающие выборки. Что совершенно недопустимо при деловой переписке и переводе официальных документов. Поэтому мы создали гибридную систему, которая использует преимущества всех трех технологий машинного перевода и нивелирует их недостатки за счёт синергии. Эта система обеспечивает перевод, в том числе мультиязычных документов, без так называемого „машинного акцента“, свойственного аналитическим системам перевода. То есть точность и гладкость выходного текста такова, что его практически невозможно отличить от текста, созданного профессиональным переводчиком».
Среди возможных сценариев использования профессиональных систем перевода он называет следующие: переписка с клиентами, партнерами, инвесторами и иностранными сотрудниками; локализация сайтов (в том числе, интернет-магазинов), перевод описаний продуктов и руководств по их эксплуатации; перевод пользовательского контента (отзывы, форумы, блоги). В числе особенностей корпоративных решений PROMT Никита Шаблыков отмечает возможность интеграции этих решений с прикладными ИТ-cистемами, уже используемыми заказчиком, а также безопасность этих решений, обусловленную тем, что они могут работать без подключения к Сети.
Особенности внедрения
Предприятиям и организациям, решившим использовать возможности нейросетевых технологий перевода PROMT для поддержки своих бизнес-процессов, необходимо перейти на
В решениях PROMT для нейронных направлений перевода используется либо основной процессор (режим CPU), либо выделенный графический процессор (режим GPU). Понятно, что в режиме GPU скорость нейромашинного перевода существенно выше, чем в режиме CPU. Необходимо использовать CUDA-совместимые видеокарты с 4 Гб видеопамяти. Как минимум, класса Nvidia GeForce 1050 Ti. Но рекомендуется класса Nvidia GeForce 1080 Ti или выше.
Что касается клиентской части (автоматизированных рабочих мест пользователя), то в ней могут использоваться браузеры Microsoft Internet Explorer версии 9 и выше; Microsoft Edge; Mozilla Firefox версии 24 и выше; Google Chrome версии 25 и выше.
При этом возможно применение широкого спектра операционных систем: Windows 7 SP1/8/8.1/10; macOS 10.8 Mountain Lion/10.9 Mavericks/10.10 Yosemite; iOS 8 и выше; Android 4.1 и выше; Windows Phone 8.1; Linux RHEL/CentOS 7.0 и выше, Ubuntu 14.04 и выше, Debian 8.0 и выше.
Важно отметить, что PROMT Neural Translation Server работает не в облаке, а интегрируется в корпоративную сеть заказчика. При этом не требуется подключения к Интернету, а потому вероятность утечек данных исключена.
По словам разработчиков, решение PROMT Neural Translation Server функционирует на основе универсальной модели, которая только для англо-русского переводчика натренирована на более чем 100 млн. параллельных текстовых сегментов (средняя длина сегмента 30 слов), созданных специалистами компании или заимствованных из открытых источников. Модули PROMT Neural написаны на языке C++.
Директор по развитию бизнеса PROMT Юлия Епифанцева отмечает, что в настоящее время наибольший интерес к технологии PROMT Neural проявляют машиностроительная и нефтегазовая отрасли, а также вузы, для которых компания предлагает решения по специальной программе «PROMT Образование», и предприятия ВПК. Компания предоставляет демо-доступ к своему серверу.