НОВЫЕ ПРОДУКТЫ
Российские переводчики получили доступ к передовому компьютерному инструментарию
Наталья Шахова, руководитель агентства переводов EnRus
Революция, о необходимости которой так долго писал PC Week (см. №№13 и 16 за 2000 г.), свершилась: российские переводчики получили наконец доступ к самому популярному в мире инструментарию - программе Translation’s Workbench фирмы Trados (для краткости и саму программу часто называют Trados). 4 декабря питерская компания ПРОМТ, известная своими программами машинного перевода (MT-программы), объявила о получении статуса эксклюзивного дистрибьютора Trados в России и других странах СНГ. К этому событию был приурочен специальный семинар по корпоративным решениям компаний ПРОМТ и Trados, а также круглый стол на тему “TM и MT: конкуренты или партнеры?”.
На международном рынке продается около десятка продуктов, использующих технологию TM, и фирма Trados выпускает самый известный из них. В основе TM-программ лежит принцип сбора и хранения фрагментов переведенных текстов на двух языках (исходный фрагмент и его перевод). Эти фрагменты хранятся в специальном накопителе переводов (Translation Memory) и служат бесценным подспорьем при последующем выполнении переводов той же тематики.
Программы этого класса достаточно дорогие, и их производители не спешили выйти на российский рынок, знаменитый масштабами своего пиратства. До сих пор в России официально продавалась, кажется, только программа Transit фирмы Star. У каждой TM-программы есть свои поклонники, и я здесь не собираюсь сравнивать достоинства продуктов различных фирм. Но Trados является абсолютным лидером на рынке, именно наличие Trados часто упоминается как обязательное условие для претендентов на тот или иной заказ. А программы других фирм обычно снабжаются конверторами в формат Trados*1.
_____
*1. Что-то это нам напоминает? И, наверное, не случайно. Microsoft использует продукт Trados для локализации своего ПО, а Trados использует MS Word в качестве базового редактора. Попробуйте угадать, кто победит на рынке TM-продуктов.
И вот наконец ведущий российский производитель MT-программ стал дистрибьютором самого популярного TM-продукта. Для того чтобы разобраться в соотношении между TM и MT, нужно посмотреть на эволюцию понятия машинного перевода.
История вопроса уходит недалеко - в середину двадцатого века. Первые теоретические разработки одни относят к 30-м, другие к 40-м годам, но практическое применение теория автоматического перевода нашла в начале 50-х годов - после появления ЭВМ. Сначала все были полны энтузиазма (“физики” тогда как раз одержали решительную победу над “лириками”). Новорожденные ЭВМ сочиняли стихи и писали музыку. Казалось, еще чуть-чуть - и машины будут легко и просто выполнять “перекодирование” (как мыслили себе этот процесс “физики”) с одного языка на другой.
Во времена холодной войны такие исследования имели особую ценность для военных, поэтому данное направление усиленно развивалось, особенно в СССР и в США. Работы шли в двух плоскостях: изучение и формализация языковых структур (структурная лингвистика) и составление алгоритмов по переводу структур одного языка в структуры другого. На языкознании это сказалось очень благотворно: под маркой высокоценных прикладных исследований удавалось проводить теоретическое изучение языков, моделирование процессов понимания, перевода и синтеза текста.
Практические результаты тоже поначалу радовали. Программы машинного перевода шли вперед семимильными шагами, и их разработчики думали, что все упирается в физические ограничения, что с развитием более мощных и быстродействующих машин переводы станут идеальными. Однако постепенно эта иллюзия развеялась. По мере снятия технических ограничений становилось ясно, что перевод текста с одного естественного языка на другой принципиально не сводится к перекодировке. Поскольку большинство слов имеет несколько значений, то основная трудность при переводе заключается именно в выборе нужного значения, для чего человек использует контекст, свой жизненный опыт и познания об окружающем мире, которые практически невозможно формализовать и загрузить в компьютер.
В этот момент разработчики без излишнего шума произвели подмену понятий. Машинный перевод разделили на три категории: полностью автоматизированный машинный перевод, машинный перевод при участии человека и перевод, осуществляемый человеком с использованием компьютера. Относительно первой категории специалисты постановили, что такой перевод по существу невозможен. Но народ об этом оповещать не стали, и широкие народные массы продолжают с энтузиазмом ждать, что компьютер вот-вот полностью заменит переводчика. На самом деле этого уже никто и не обещает.
Реально автоматизированный машинный перевод возможен только в условиях искусственно ограниченного (как по словарному запасу, так и по грамматике) языка - например, можно автоматизировать перевод высказываний Эллочки Щукиной (персонажа “Двенадцати стульев”). В качестве реального успешного проекта всегда упоминают канадскую систему Meteo, выполняющую перевод метеопрогнозов с французского на английский и обратно (легко понять, насколько ограничен язык этих прогнозов: ветер северо-восточный, осадки в виде мокрого снега и т. п.).
Еще один типичный пример использования программ машинного перевода заключается в том, что с их помощью просматривают большие массивы данных (например, содержание веб-сайтов) в поисках нужного документа, который затем переводят уже по-человечески. Здесь речь не идет об адекватной передаче всей информации исходного текста: т. е. MT-программы используются не для точного перевода документа (результатом не служит связный текст, соответствующий исходному), а лишь для его механической проекции (программа выдает набор слов с нарушенными грамматическими связями и предлагаемыми на выбор вариантами значений).
Во всех остальных случаях под машинным переводом понимается процесс, включающий тесное сотрудничество человека с компьютером. Именно такое сотрудничество и призваны обеспечить как собственные программы компании ПРОМТ (Stylus, PROMT и др.), так и предлагаемые ею программы фирмы Trados. Принципиальное различие между этими продуктами заключается в том, что MT-программы рассчитаны прежде всего на любительский перевод*1), а TM-программы годятся только профессиональным переводчикам.
_____
*1. По признанию сотрудников ПРОМТ, 80% использования их программ приходится на людей, выполняющих не перевод, а поиск.
Оставив в стороне использование MT-программ обычными людьми для поиска (поскольку эта область выходит за рамки данной статьи), посмотрим, как их могут применять переводчики-профессионалы. Здесь очень важно, во-первых, подключить специализированные словари, соответствующие тематике переводимого текста, а во-вторых, должным образом настроить программу-переводчик (например, указать ей, что слова вроде Microsoft или Windows переводить не нужно). Кроме того, получившийся “перевод” нужно подвергнуть интенсивному редактированию, и делать это должен высококвалифицированный переводчик (а не человек, учивший иностранный язык в школе), иначе в текст неизбежно вкрадутся ошибки.
Настройка программы и редактирование результатов ее деятельности требуют настолько много времени, что использование MT-программ дает выигрыш только при переводе по-настоящему объемных массивов однородной документации с большим количеством повторений. При этом участие в роли редактора квалифицированного переводчика является необходимым условием. Однако по качеству такие переводы все равно будут, как правило, близки к подстрочнику, потому что даже самый опытный редактор невольно подпадает под влияние слишком буквального выбора слов и слишком точного сохранения исходного порядка слов, характерных для автоматических переводов. Глаз редактора быстро “замыливается”, и текст наполняется “шедеврами” вроде: “В течение эйфории конечных лет двадцатого столетия революция случалась среди всех других революций”. Если же человек начинает бороться с такими нескладушками и пересказывать все своими словами, то выигрыш во времени пропадает.
Иное дело TM-программы. Здесь в основу перевода ложатся конструкции, выбранные человеком. Поэтому если наполнением накопителя занимался хороший переводчик, то и варианты, предлагаемые программой, будут хорошими. Важно лишь понимать, что MT-программы опираются на готовые словари и поэтому готовы к работе в момент покупки. А для TM-программ базой служит накопитель, который в момент покупки программы пуст. Для того чтобы начать плодотворно использовать TM-программу, накопитель нужно наполнить соответствующими выражениями, причем при переходе к текстам новой тематики нужно снова прилагать усилия, заполняя новый накопитель новыми выражениями. И качество перевода существенно зависит от качества такого накопителя, от того, знающий человек его наполнял или нет.
Правда, здесь есть и положительная сторона: накопителями можно обмениваться, поэтому в больших коллективных проектах накопитель может заполнить самый лучший переводчик, а все остальные будут пользоваться плодами его трудов, что повысит качество их работы и обеспечит единство терминологии.
Итак, подводя итоги, можно сказать, что при использовании MT-программ путь прокладывает компьютер, а потом человек поправляет своего компьютерного помощника, часто подпадая под его влияние. А при работе с TM-программами все происходит наоборот: сначала человек придумывает, как перевести то или иное выражение, а компьютерный помощник фиксирует его находки и в нужный момент подсказывает: вот это ты раньше переводил так. И человек все время имеет возможность отмахнуться от подсказки: мол, здесь такой вариант не проходит.
За десять лет работы компания ПРОМТ продала 150 тыс. лицензий на свои продукты, а ее бесплатным сервисом на сайте www.translate.ru ежедневно пользуются тысячи энтузиастов*1. Следует только понимать, что в большинстве случаев речь не идет о создании полноценных эквивалентов исходных документов на другом языке. В то же время компания Trados за 17 лет своего существования продала 45 тыс. лицензий, и все они приобретены профессиональными переводчиками и используются именно для перевода. (Разумеется, и стоимость этих продуктов несопоставима.)
_____
*1. По словам менеджера по маркетингу Александра Андреева, компания получает массу благодарственных писем от иностранных женихов, которым этот сайт помог обрести русских невест.
Для крупных проектов, где речь идет об оперативном переводе сотен страниц однородной документации ежемесячно, представляется перспективным сочетание TM- и MT-программ, при котором переводчики работают с накопителем, а те фрагменты, которые в нем отсутствуют, отправляются на машинный перевод и затем корректируются. На семинаре выступили Владимир Леонов (Lucent Technologies) и Марина Нечаева (“Буиг-Офшор”), которые рассказали об успешном сотрудничестве с ПРОМТ именно в использовании сочетания Trados+Promt*1.
_____
*1. Для совместного использования своих MT-программ и продуктов Trados ПРОМТ предлагает специальные средства сопряжения.
Во время круглого стола особых споров не возникло (по крайней мере, мне, как ведущей, разнимать никого не пришлось). Коммерческий директор ПРОМТ Михаил Каничев жаловался на неразумных пользователей, которые, как в том анекдоте про российских мужиков, подсунувших лом в заграничную электропилу, пытаются озадачить MT-программы замысловатыми конструкциями, для борьбы с которыми эти программы не предназначены. А переводчики сдержанно приветствовали Trados: их радость умерялась высокой стоимостью продукта и опасениями, что его использование может привести к падению цен на переводческие услуги*1. Все вместе дружно сетовали на то, что клиенты шарахаются от одного упоминания о машинном переводе, дискредитированного неумелым применением и неудачным названием. Ведь современный машинный перевод далеко не такой автоматизированный, как многие думают.
_____
*1. В продукт встроена система учета стопроцентных совпадений, а работодатели норовят уклониться от оплаты повторов.
P. S. Во время подготовки этого материала я получила от одного из американских клиентов нашего агентства уведомление о том, что с 1 января они будут сотрудничать только с теми переводчиками, у которых есть Trados. Этот ультиматум послужил для нас последней каплей, и мы купили себе Trados, благо в России теперь есть такая возможность.