Сегодня все больше организаций обращается к технологиям безбумажного пользования массивом документов, переводя их в электронный формат, создавая информационно-поисковые системы и электронные архивы. Архивы России — не исключение. В то время как многие из них только приступают к организации этих работ, Российский государственный архив научно-технической документации (РГАНТД) уже несколько десятилетий идет в ногу с технологиями автоматизации работы с архивными документами. И в настоящий момент готовится к активной оцифровке особо ценных и наиболее востребованных документов из своих фондов научно-технической документации (НТД).
РГАНТД создан постановлением Правительства РФ № 575 от 09.09.95 г. на базе Российского научно-исследовательского центра космической документации (РНИЦКД) в Москве и Российского государственного научно-технического архива в Самаре. Включив в свой состав Центральную лабораторию реставрации и микрофильмирования Росархива, РГАНТД получил объёмную представительную базу архивных материалов. Среди них микрофильмы, отчеты научно-исследовательских и опытно-конструкторскими работ (НИОКР), чертежи, фото-, фонодокументы, в том числе бортовые съемки, переговоры с космическими кораблями, видео- и кинодокументы, съемки конференций, встреч экипажей и т. д.
В чем проблематика оцифровки НТД, каковы критерии отбора документов для проведения оцифровки начальник отдела автоматизированных архивных технологий РГАНТД Геннадий Залаев рассказал корреспонденту PC Week/RE
PC Week: В чем заключается важность проведения работ по оцифровке документов РГАНТД?
Геннадий Залаев: Прежде всего, оцифровка важна для создания фонда пользования. Для того чтобы пользователь работал не с оригиналами, а с копиями документов. Это во многом гарантирует сохранность оригиналов. Кроме того, мы располагаем уникальными, особо ценными, но уже ставшие ветхими документами. Брать в руки, а тем более работать с ними очень сложно. Оцифровка позволит ввести их в научный оборот. Кроме того, оцифровка позволит расширить доступ к архивным документам и при разработке соответствующей законодательной базы решить вопросы создания страхового фонда архивных документов на цифровых носителях. В настоящий момент такой законодательной базы нет.
PC Week: Каковы требования к оцифровке таких документов?
Г. З.: Качество оцифровки должно быть таким, чтобы цифровая копия могла заменить оригинал во всех возможных случаях его использования, при его утере или порче. Но здесь есть одна очень интересная особенность. Страховой фонд создается на микроформах, а законодательной базы, которая позволяла бы создавать его на цифровых носителях, как я уже говорил нет. Вот простой пример: магнитной ленте, на которую записаны первые переговоры космонавтов “Борт — Земля”, уже более 50 лет. Годы идут, лента осыпается. Чтобы сохранить эту уникальную запись, необходимо перенести информацию на другой носитель. Но по нынешним архивным правилам магнитная лента перезаписывается на магнитную ленту. Можно ли это сделать сейчас? Можно. Но очень дорого. Есть профессиональные магнитофоны, но их стоимость варьируется от 25 до 30 тыс. долл. Какой выход? Оцифровать, чтобы обеспечить сохранность информации. Но создавать официальный страховой фонд на электронных носителях пока нельзя. Поэтому создаем его аналог — фонд обеспечения сохранности документов. Пожалуй, это самая актуальная проблема сегодня в архивном деле, большой вопрос для архивистов и Росархива.
PC Week: Проводились ли в РГАНТД работы по оцифровке документов?
Г. З.: Масштабной оцифровки бумажных документов у нас, к сожалению, еще не было. Но мы активно оцифровываем фотодокументы и фонодокументы. На эти виды документов достаточно большой спрос. На НТД спрос со стороны исследователей, в силу, вероятно, специфики такой документации (некоторые объекты еще летают в космос, например ракетоноситель “Протон”), меньше.
Организации-сдатчики запрашивают архивную НТД в случае нештатных ситуаций. И здесь оцифровка, конечно, была бы эффективнее. Что проще вывезти: несколько дисков с информацией или грузовик документов?
Важно отметить, что, когда мы говорим об оцифровке документов, связанных с космической отраслью, это не касается секретной документации. Мы никогда не вводили в БД документы, с которых не сняты грифы “Секретно” или “Совершенно секретно”.
До настоящего времени в отношении оцифровки было два направления: оцифровывали НТД или по просьбе исследователей, или эти работы были связаны с подготовкой к интернет-выставкам. Мы столкнулись и с технической проблемой — отсутствием широкоформатных сканеров. Приходилось сканировать частями на профессиональном сканере формата А3, потом “сшивать” куски документа.
PC Week: Космическая документация — это основное, что хранится в ГРАНТД? Какие работы по автоматизации хранения проводились ранее?
Г. З.: Сейчас сдаваемая техническая документация представлена уже другими направлениями и организациями. Архив комплектуется документами от научно-технических организаций как гражданского, так и военного профиля, государственной и других форм собственности, сохранив за собой приоритет в комплектовании поливидового комплекса документов по истории отечественной космонавтики. В свое время в РНИЦКД на базе ЕС ЭВМ создавались первые в архивной отрасли автоматизированные информационно-поисковые системы (АИПС): система по истории освоения космического пространства; документы Великой Октябрьской революции и триумфального шествия советской власти; история архитектуры и градостроительства Москвы, Санкт-Петербурга и пригородов. Заслуга РНИЦКД заключается в том, что были разработаны типовые технологии и сгенерировано ПО для этих систем. Сегодня большой популярностью у исследователей, представителей риэлторских компаний пользуется АИПС по истории архитектуры и градостроительства. Спрос так велик, что мы сделали интернет-версию этой системы.
PC Week: Расскажите, пожалуйста, об истории создания и развития этих АИПС.
Г. З.: Еще в годы существования Центра космической документации мы начали вести БД на ЭВМ, используя настраиваемый пакет прикладных программ AIDOS — разработка комбината Robotron (ГДР, г. Дрезден). Пользователю не нужно было программировать, необходимо было только знать язык управления. Когда произошло воссоединение двух Германий, мы поняли, что Robotron могут закрыть и развитие AIDOS прекратится. Поэтому перешли на систему ISIS. Это настраиваемый пакет программ, предложенный ЮНЕСКО специально для архивов и библиотек, который позволял нам создавать базы данных и даже помогать другим архивам. При этом мы разработали инструкции, методические материалы, осуществляли поддержку БД, которые внедряли в другие архивы. ISIS и теперь активно используется архивами различных стран, например, в странах Южной Америки, в Польше, и мы также до сих пор его применяем.
Чуть позже мы разработали современную автоматизированную информационно-поисковую систему с цифровыми копиями архивных документов (АИПС ЦКД), которая основана на технологии клиент-сервер и реализована на базе SQL. Она позволяет получать в ответ на информационный запрос цифровые копии документов и их описания.
Отмечу, что для различных тематических комплексов архивных документов мы использовали одну и ту же технологию обработки информации и один и тот же пакет прикладных программ — сначала AIDOS, потом ISIS и АИПС ЦКД.
PC Week: Можно ли назвать Центр космической документации лидером своего времени в архивной отрасли по оцифровке, разработке и наполнению информационно-поисковых систем?
Г. З.: Да, действительно, мы начали разработку информационных систем еще в 1980-е и в архивной отрасли были единственными, кто вел подобные работы. Первыми начали использовать возможности Интернета для работы с архивной информацией. Впоследствии организации из научно-технической сферы, работавшие с оперативной научно-технической информацией, шли примерно по тому же пути.
PC Week: Что оцифровали в 2000-е?
Г. З.: Главным образом, пополняли новой информацией наши три комплекса архивных документов. С 2000 г. мы получили возможность не только вводить в АИПС описание документов, но и присоединять цифровые копии. Начали с оцифровки наиболее востребованных фотодокументов. Сейчас также активно оцифровываем фото- и фонодокументы. Особое внимание переговорам “Борт — Земля”, потому что магнитные ленты рассыпаются.
PC Week: Как работает АИПС в настоящее время?
Г. З.: К информации в системах через локальную сеть есть доступ и из читального зала, и из других подразделений архива. Введены разграничения доступа к системе. Например, отдел автоматизированных архивных технологий, ведущий разработку и техническое обслуживание систем, имеет доступ ко всем подсистемам АИПС ЦКД во всех режимах работы. Отдел научно-справочного аппарата, занимающийся только вводом информации, соответственно может вводить и редактировать информацию. А отдел использования, куда приходят пользователи, осуществляет поиск и просмотр информации. Кроме того, в читальном зале установлена система видеонаблюдения, поэтому никаких вольностей пользователи позволить себе не могут.
PC Week: Получается, что в читальном зале человек может обратиться к системе и найти нужный документ? Но сам документ, к примеру чертеж, он получит на бумаге?
Г. З.: Если есть цифровая копия искомого документа, то он получит документ в цифре. Это быстро и просто. Если цифровой копии нет, то на бумаге, или мы можем специально для него сделать цифровую копию. Перед нами стоит задача в будущем году разработать методические рекомендации по сканированию НТД. Будем активно оцифровывать чертежи, отчеты НИОКР, уникальную и особо ценную документацию для того, чтобы исследователь мог получать цифровую копию.
PC Week: Что было сделано в рамках Федеральной целевой программы “Культура России"?
Г. З.: Федеральная целевая программа нам дала очень многое. По этой программе мы получали деньги на создание интернет-выставок, на приобретение техники, специальных дисков для архивного хранения. Кроме того, мы провели ряд исследований и подготовили методические рекомендации по сканированию архивных документов. Это большая и серьезная работа, требующая серьезного подхода. Надеемся, что она и дальше будет финансироваться по ФЦП.
PC Week: В чем заключается специфика оцифровки архивных материалов?
Г. З.: Прежде всего в том, что архивные документы требуют бережного отношения. Мы выбирали специальное оборудование, сканеры, которые не оказывают влияние состояние носителя (бумагу) и на состояние контента. В 2012 г. были разработаны методические рекомендации по созданию фонда пользования и сканированию архивных документов, которые мы используем. Эта работа также финансировалось по ФЦП.
Чем хороша технология оцифровки? Если раньше для создания копий архивной НТД мы использовали ксерокопирование, то при копировании с ксерокопии третий и четвертый вариант были почти нечитаемыми. В случае с оцифровкой сделайте хоть 100 копий, они все будут идентичны. Но при этом возникает проблема иного характера — сложно определить, что является подлинником, что дубликатом, а что копией. Пока для дефиниции этих понятий в основном используется ГОСТ 6.10.4-84. Однако во времена его создания не было термина “электронный документ”. ГОСТ устанавливает требования к составу и содержанию реквизитов, придающих юридическую силу документам на машинном носителе. Это — к вопросу о необходимости совершенствования законодательной и нормативной базы.
PC Week: Насколько вы готовы к массовой оцифровке?
Г. З.: Я бы не стал употреблять слово “массовая”. Ведь документов в архиве много, и поэтому мы не можем оцифровать все сразу. Поэтому должны быть выработаны ясные критерии, должна быть определена поступательность, очередность оцифровки. Например, сначала оцифровать наиболее востребованные документы, затем — ветхие, далее — уникальные и особо ценные. Можно проводить оцифровку, объединив критерии выбора приоритетов оцифровки, те или иные группы документов.
PC Week: План этих работ уже составлен?
Г. З.: Для аудиовизуальных документов такой план существует. Для НТД будем составлять. Технику для оцифровки НТД мы получили совсем недавно. У нас уже есть перечень особо ценных документов, по нему и будем действовать. Но прежде необходимо разработать методические материалы.
PC Week: Эти методические рекомендации будут доступны всем заинтересованным организациям через Интернет?
Г. З.: Обязательно. Все результаты разработок и исследований, проводимых в рамках ФЦП, публикуются на сайте Росархива. Мы надеемся выиграть тендер на создание методических рекомендаций, чтобы получить достаточное финансирование этой очень нужной для архивной отрасли научно-исследовательской работы и проводить ее в рамках той же ФЦП. После, конечно, все материалы опубликуем на сайте. Ведь они разрабатываются и для сторонних организаций в том числе.
PC Week: Насколько важна единая методология?
Г. З.: К примеру, мы сейчас ведем переговоры о приеме на хранение документов проектных организаций, которые они планируют сдавать в электронном виде. При этом будут возникать определённые вопросы. Они сдают материалы, записав их на обычный диск. Но мы-то должны их переписать на диски для архивного хранения. А прежде — просмотреть все документы и их копии, что это чертежи изделия или что-либо другое. Информационные технологии — хорошо, но все-таки это палка о двух концах.
Оцифровка архивных документов, безусловно необходима. Но прежде чем налаживать такую технологию, нужно провести дополнительные работы по анализу и описанию поступающих материалов, по их перезаписи для архивного хранения. В настоящий момент запись на диски — это уже не очень эффективно, поэтому рассматривается вопрос использования серверного хранения и систем хранения данных с резервным копированием на цифровую магнитную ленту. Но здесь возникают проблемы чисто архивного порядка. Например, хранение на сервере фонда пользования. Архивные правила подразумевают, что фонд пользования должен размещаться в архивохранилище, в то время как сервер находится на веб-узле. При внедрении современных ИТ в практику работы архивов много трудностей, но и много интересного.
PC Week: Спасибо за беседу.