Опыт решения общенациональной задачи усилиями государственного и частного капитала
Идея перевода книжных хранилищ в электронную форму далеко не нова. Первые попытки были сделаны еще во время появления у компьютеров накопителей на магнитных лентах. Систематически воплощать идею в жизнь стали американцы в середине 80-х годов, когда начались работы по созданию электронной версии Библиотеки Конгресса США (catalog.loc.gov). Сейчас они перевели в электронную форму уже более 5 млн. единиц хранения. Это не только книги, но и статьи, отдельные фотографии и т. д. Аналогичные работы ведет Национальная библиотека Франции, недавно она выставила в Интернете (www.BNF.fr) 86 тыс. отсканированных книг. Всего в мире осуществляется пять крупных проектов такого рода. Разумеется, они требуют вложения огромных денег, а также труда тысяч сотрудников, сканирующих и вычитывающих книги. Сегодня в мире идет гонка - кто “оцифрует“ хранилища первым. Работа достаточно трудоемкая, требующая создания определенной технологии.
В этой связи событие, которое произошло 15 ноября в здании Российской государственной библиотеки (РГБ), можно считать знаковым. Там в присутствии многочисленных гостей компания Adamant Media передала РГБ первую партию в 540 электронных книг, созданных на основе фондов библиотеки. Сотрудничество РГБ с компанией Adamant Media проходит в рамках проекта ELIBRON (Electronic Library Online), в ходе которого предполагается перевести в электронный вид один миллион книг на 200 языках.
Президент Adamant Media Андрей Волгин, оценивая первый этап работы по этому проекту, рассказал о проблемах создания электронных книг и пути, пройденном корпорацией. (Штаб-квартира Adamant Media находится в Бостоне, в ее российском отделении работает около 400 человек.)
Идея заняться электронной библиотекой возникла у г-на Волгина два года назад. Тогда и образовалась корпорация Adamant Media, поставившая перед собой задачу создать электронные библиотеки, способные конкурировать с самыми большими электронными библиотеками мира. Проектов электронных библиотек в Интернете уже в то время было довольно много. Вообще говоря, современные технологии позволяют заниматься этим и в домашних условиях, достаточно иметь компьютер, сканер и программу распознавания текстов. Но если речь идет не о десятках и сотнях книг, а о десятках и сотнях тысяч, то требуется разработка технологического процесса. При этом технология должна быть достаточно дешевой, чтобы проект был коммерчески реализуем. Именно эту задачу и решила корпорация Adamant Media.
Самый простой способ, который, кстати, используют французы, - разрезать перед сканированием книги на отдельные страницы. Однако по условиям РГБ, книги - а среди них множество уникальных - не должны пострадать от операции оцифровки. Поэтому пришлось купить специальный книжный сканер, стоимостью порядка 30 000 долл. Такие сканеры оснащены специальными лампами, которые не наносят вреда книгам. После сканирования изображение страницы “чистится” от пятен и пометок, оставленных читателями. Некоторые книги, содержащие много иллюстраций или имеющие оригинальные шрифты, сохраняются в виде изображений страниц. Остальные обрабатываются программой распознавания текстов (используется FineReader 5.0), а затем полученный текстовый файл дважды проверяется корректорами (на это затрачивается до 40 часов рабочего времени), верстается, к нему изготавливается обложка. Такая книга в формате PDF может быть загружена с сайта, напечатана по требованию в единичном экземпляре и т. д.
Президент Adamant Media Андрей Волгин
До сотрудничества с РГБ Adamant Media начала изготавливать электронные собрания сочинений самых популярных авторов - А. С. Пушкина, А. П. Чехова, Ф. М. Достоевского и др. При этом появились две проблемы: во-первых, наличие книг. Adamant Media покупала множество книг и в Москве, и в Санкт-Петербурге, откуда привозила их целыми автобусами, но это оказалось трудоемко, дорого и нетехнологично. А главное - не соответствовало тем масштабам, на которые корпорация рассчитывала. Вторая проблема маркетинговая - требовалось знать, какие книги нужны пользователям. Поэтому Adamant Media стала искать партнера среди крупных библиотек. Такой альянс состоялся более года назад с РГБ.
Понятно, что Adamant Media была далеко не первой, кто что-то предложил библиотеке, но, как заявил г-н Волгин, она оказалась первой, реально выполнившей все свои обещания. Начали с небольших объемов. В ноябре прошлого года на базе РГБ был открыт первый центр по подготовке электронных книг. Постепенно в Ленинке росло понимание важности этой работы. В частности, Adamant Media профинансировала создание электронного каталога библиотеки. Это 4,5 млн. учетных карточек. Они были отсканированы при помощи специалистов фирмы Prosoft-M в рекордно короткий срок за - 3,5 месяца. На сегодняшний день обработкой этого материала занимается около 40 человек и работа по их переводу в текстовый вид также может занять не один месяц.
Adamant Media за свой счет реконструировала одно из зданий РГБ на Моховой, чтобы разместить там центр по переводу книг в электронную форму. Сейчас в центре создаются рабочие места для двухсот человек.
По словам г-на Волгина, проект Adamant Media от других отличает то, что с самого начала делаются электронные книги на многих языках. Исходно ставилась задача создания глобальной библиотеки. “Мы считаем, - сказал г-н Волгин, - что книги на иностранных языках и внутри России пользуются огромным спросом. Часто кроме как через Интернет их получить невозможно”.
Следует подчеркнуть уважение корпорации к авторскому праву. Проверенный путь, по словам г-на Волгина, следующий: если книга была опубликована до 31 декабря 1922 г. и при этом ее автор умер до 1944 г., то эта книга, как правило, является общедоступной во всем мире. То есть на нее не распространяется авторское право. Но нужно учитывать особенности национального законодательства. Например, по французским законам, если автор погиб за Францию, то авторское право на его произведения продлевается на 30 лет. Причем выяснить это не всегда просто. Так, как и легко предположить, Сент-Экзюпери считается погибшим за Францию. Поэтому корпорации приходится буквально по каждой книге выяснять, истек ли срок авторского права.
Adamant Media планирует плавно перейти от сканирования старых книг к новым и ведет работу с крупными издательствами, литературными агентствами и известными авторами с целью приобретения прав на нужные книги. Поэтому, когда сайт www.elibrin.com (его открытие планируется в январе, однако уже с декабря сайт начнет функционировать в тестовом режиме) достигнет определенного уровня популярности, корпорация сможет предложить посетителям и новые книги.
Некоторые ресурсы сайта будут бесплатными, а некоторые, например печать книги по требованию, - платными. Как рассказал директор РГБ Виктор Васильевич Федоров, проект с Adamant Media у РГБ не единственный. Есть проект с Библиотекой Конгресса США “Встреча на границе”, проект “Русский курьер” и др., однако по интенсивности и объему работ проект с Adamant Media - главный. В нем мы впервые наблюдаем удачное совмещение государственного и частного капитала для решения общенациональной задачи.