МНЕНИЯ
Не буду самонадеянно пытаться решить глобальную проблему добра и зла - моя задача гораздо скромнее: объяснить, почему, по моему мнению, машинный перевод (Machine Translation, MT) - это плохо, а переводческий накопитель (Translation Memory, TM) - хорошо.
Для начала, ясное дело, требуется пояснить, что такое “переводческий накопитель”. Ведь если понятие “машинный перевод” является общеизвестным, то термин “переводческий накопитель” в российской прессе мне пока не встречался. А между тем на Западе технология TM и созданный на ее базе инструментарий переводчика - Translation Memory Tools (TMT) - хорошо известны. Просто удивительно, как в век Интернета мы умудрились пройти мимо целого класса новых продуктов. (И не такие уж они новые: один из производителей подобных программ осенью отметил свой пятнадцатитилетний юбилей!)
Будучи переводчиком, я столкнулась с термином TMT в объявлениях иностранных агентств: нужен переводчик, наличие TMT обязательно. Причем обычно указывается конкретный продукт из пяти-шести наиболее популярных. Чаще всего в этом контексте фигурирует пакет Translation’s Benchmark фирмы Trados, который многие называют просто Trados. Прошлогодний опрос показал, что в мире уже 15% переводчиков пользуются тем или иным TM-инструментарием.
Когда же я попыталась узнать, насколько TM-технология распространена у нас, и задала соответствующий вопрос в конференции русскоязычных переводчиков ruslanta, то в ответ получила шквал сообщений о программах машинного перевода (MT-программах). Мне же кажется, что разница между TM и MT такая же, как между вечным двигателем и двигателем автомобиля.
Приверженцы MT-программ делятся на две неравные группы: любителей прогресса, которые никогда на практике с машинным переводом не сталкивались, но приветствуют все новое и передовое, и разработчиков - эти относятся к своим делающим первые робкие шаги детищам, как всякие родители: смотрите, как мой малыш хорошо рисует, ну чистый Матисс!
Со вторыми спорить так же бессмысленно, как уверять восторженную мамашу, что ее вундеркинду хорошо бы немного подучиться рисунку, композиции и т. п. Поэтому единственное, на что я рассчитываю, это несколько пошатнуть веру энтузиастов-профанов.
Большинство читателей, наверное, согласится, что при переводе художественных текстов важно передать не только информацию, но и настроение, оттенки и нюансы, которые в значительной мере определяются контекстом, культурной средой, национальным образом жизни и прочими неформализуемыми вещами. Ведь если казашка воспринимает сравнение с верблюжонком как комплимент, то русская может подумать, что это намек на сутулость. И если для русского угощение в виде холодного чая явно говорит о безалаберности и отсутствии гостеприимства, то для американца чай со льдом - стандартный напиток. (Более подробно особенности различных видов переводов я рассматриваю в статье, размещенной по адресу: www.russ.ru/ist_sovr/20000328_shahova.html.
Поэтому оставим в стороне Шекспира и даже Агату Кристи. Мало кто утверждает, что перевод их произведений можно автоматизировать. Поговорим о технических и даже, ориентируясь на специализацию PC Week/RE, только о компьютерных текстах. Общепринято заблуждение, что их-то машинный переводчик щелкает как орешки. Попытаюсь объяснить, почему это не так.
Разработчики, а вслед за ними и энтузиасты-любители подчеркивают, что грамотное использование MT-программы подразумевает подключение специализированных словарей. Однако какой словарь нужен при переводе статьи о программном обеспечении для бухгалтерии? И если подключить оба - компьютерный и финансовый, то в каком из них искать слова “account” и “transaction”?
Играя с MT-программой, я как-то получила такой заголовок для пресс-релиза: “Удовлетворение Клиента с Сервером Биржи”. Он возник в результате того, что программа перевела название продукта Exchange Server как Сервер Биржи. С этой трудностью - определением того, что нужно перевести, а что нужно оставить на языке оригинала, - постоянно сталкиваются и люди; единого рецепта здесь нет*. На помощь приходит только регулярно пополняемый запас знаний и здравый смысл. Конечно, “Окна” возникают лишь в переводах малограмотных халтурщиков, но является ли какое-нибудь “Network Management Software” именем собственным или нет, часто приходится гадать. И принимать во внимание при этом гадании такие непредсказуемые вещи, на которые нельзя натаскать программу.
Неуместный перевод имен собственных существенно затрудняет чтение текста. “Американское Преобразование Мощности заключило соглашение с Солнцем”. Тот, кто понял, что MT-программа ведет здесь речь о компаниях APC и Sun, может взять с полки пирожок.
Еще один стандартный камень преткновения - сокращения. Типичный пример: “мудрая” программа, вопреки замыслу автора текста, писавшего о компании Hewlett-Packard, перевела HP как “Лошадиная Сила”. Хорошо, скажет рьяный сторонник прогресса, MT-программа должна сверяться со специализированным списком сокращений. Согласна, но что делать с милой привычкой американцев вводить сокращения по ходу дела без предупреждения? Неохота им тащить через весь текст длинное название проекта Very Effective Project, и вот уже появляется сокращение VEF, которое нигде больше не используется. Переводчик-профессионал всегда готов к такому повороту дела, а его электронного сменщика не так-то просто научить подбирать расшифровки в тексте.
И наоборот: некоторые вещи, не вызывающие затруднений у машинного переводчика, ставят в тупик человека. Недавно я получила от американского клиента очень выгодный заказ, от которого в итоге пришлось отказаться. Руководитель заграничного агентства просил перевести несколько перенумерованных текстовых цепочек. Вот фрагмент из этого списка:
6. About
7. Help
8. Hot Key Display Time
9. Select the number of seconds to show the Hot Key
10. On-Screen Display
11. second
12. seconds
13. Use this button to
Ясно, что это надписи из диалоговых окон. Любая MT-программа перевела бы их в мгновение ока. Я же представила себе, как нелепо будет выглядеть диалоговое окно, механически собранное из таких кирпичиков, и решила не гнаться за длинным долларом, а блюсти профессиональную честь. Я написала заказчику, что если мне не предоставят изображений соответствующих экранов, то я за эту работу не возьмусь. И не взялась.
Возможно, кому-то мои рассуждения напоминают борьбу луддитов против ткацких станков. Да, действительно, я - переводчик, и когда перевод станет доступен ПК, я могу остаться без работы. Но я считаю, что это - отдаленная перспектива и в ближайшие, скажем, сто лет программы машинного перевода никакой опасности для меня не представляют.
Если, например, шахматные программы уже играют на уровне гроссмейстеров, то MT-программы находятся в самом начале своего развития и, продолжая параллель, можно сказать, что они пока путают короля с “королевой” и слабо знают, как ходит “тура”.
Причем с шахматами программисты провозились не одно десятилетие, прежде чем достигли нынешних высот. А ведь шахматное искусство, несмотря на огромное количество вариантов, имеет перед искусством перевода преимущество довольно строгих критериев. Есть позиции выигрышные, а есть проигрышные - это понятия объективные. А о том, кто лучше перевел Гамлета, споры не затихают уже много лет.
Для чего же MT годится? Для перевода больших массивов однородных текстов с небольшим узкоспециализированным словарным запасом и примитивной грамматикой. Почему больших? Потому что настройка программы на текст определенного типа занимает много времени, и это себя оправдывает, только если необходимо перевести достаточно объемный текст. Почему однородных? Потому что для каждого переводимого текста следует раз и навсегда оговорить, про какой лук в нем говорится: про тугой со стрелами или про молодой зеленый. Почему с небольшим словарным запасом? Потому что нужно исключить омонимы для всех входящих в текст слов. А грамматика должна быть примитивной, потому что со сложными конструкциями современные программы не справляются.
Для чего MT не годится? Для перевода художественной литературы, журнальных и газетных статей, писем, каталогов, аннотаций, рефератов и т. п.
Даже разработчики MT-программ признают, что современные программы дают разумный результат только после настройки их на конкретную языковую ситуацию. То есть следует установить словарь из соответствующей предметной области, указать тип текста и откорректировать несколько первых страниц перевода, задав программе определенные эталоны.
Иначе говоря, MT может помочь в работе над большим однородным массивом профессиональному переводчику, хорошо владеющему тематикой и прекрасно понимающему этот текст, а вовсе не тому, кто хочет узнать что-то новое и слабо знает иностранный язык.
Так вот для этой цели гораздо лучше приспособлены TM-программы. Их основное отличие от MT-программ заключается в ограниченной самостоятельности. MT переводят сами, TM помогают человеку накапливать опыт и опираться на него в дальнейшей работе.
Переводческий накопитель - это специальным образом организованная индивидуальная база данных. Она создается конкретным переводчиком (или коллективом переводчиков) в ходе работы над конкретным проектом. То есть в ее основе лежат знания, интеллект и профессионализм человека. (Особенно удобно то, что один высококвалифицированный специалист способен создать переводческий накопитель, который позволит более качественно работать всему, быть может, менее квалифицированному коллективу.)
По мере накопления в базе материала (пар слов и выражений на двух языках) она становится все более полезной. При переводе какого-нибудь многостраничного руководства пользователя может наступить такой момент, когда вы уже подобрали эквиваленты для всех встречающихся в нем выражений и оставшаяся часть текста переводится автоматически.
Кроме того, большинство TM-продуктов избавляют пользователя от необходимости знакомиться с различными текстовыми процессорами. Достаточно изучить особенности текстового редактора самого продукта, и вам станет подвластно все разнообразие текстов, будь они представлены в QuarkXPress, FrameMaker или Adobe Illustrator. Здесь есть, конечно, некоторый подвох: для того чтобы справиться с очередным текстовым процессором или издательской системой, вам понадобится соответствующая программа-фильтр, которая - что? Правильно - продается за отдельные деньги! Вообще денежный вопрос самый серьезный, когда речь идет о TMT. Стоят они недешево (как правило, несколько сотен долларов), совместимости, понятное дело, нет. Поэтому если вы приобрели (и освоили!) какой-либо продукт для одного проекта, то для следующего может потребоваться приобрести другой продукт и снова тратить время на его изучение.
На Западе уже вовсю обсуждают последствия повсеместного распространения таких программ. Одно из них заключается в том, что переводчик-новичок теряет возможность выйти на рынок. Точно так же, как в России уже очень трудно получить заказ переводчику, если у него нет компьютера и принтера, так за границей возникают проблемы трудоустройства у переводчиков, не имеющих TM-программы. У этого явления есть и положительная сторона - нанимая на работу владельца TM-программы, заказчик получает некоторую гарантию его профессионализма. Но ведь и новички должны иметь возможность стартовать!
Другое последствие - влияние TM-программ на язык. Некоторые предсказывают, что в результате применения этих инструментов произойдет упрощение и вырождение всех языков за счет стандартизации, отбрасывания синонимов и упрощения грамматических конструкций. (См., например, www.oreilly.com/news/babel_0300.html.)
Однако русскому языку TM-инструментарий (ввиду его практически полного отсутствия в России) пока угрожает несравнимо меньше, чем простые “безлошадные” переводчики, готовые писать “пользователь получает большую пользу от использования этих полезных новаторств”. А вот сами переводчики из-за отсутствия TM-программ рискуют оказаться отрезанными от международного рынка труда.
Продолжение темы в следующих номерах
С Натальей Шаховой, директором агентства EnRus, можно связаться по адресу: natalie@lamport.ru.