К управлению корпоративной информацией (или контентом) можно подойти и со стороны практики, и со стороны теории. Несомненно, практические аспекты этого процесса более интересны, прежде всего в силу своей бизнес-направленности. Однако чтобы разнообразные практические вопросы сложились в структурированную систему знаний, необходим некоторый теоретический базис.
В данной статье речь пойдет о технологиях, лежащих в основе управления корпоративной информацией. Разговор о технологиях Enterprise Content Management (ECM) правильнее будет начать с определения этого понятия. В среде профессионалов рынка ECM принято считать каноническим определение, которое даёт AIIM (Association for Information and Image Management). Для начала заглянем в глоссарий. Итак, по версии AIIM “…управление корпоративной информацией — это совокупность стратегий, методик и инструментов, используемых для захвата, хранения, защиты и доставки информации и документов, относящихся к бизнес-процессам организации”.
В приведенном определении можно выделить два очень важных момента.
Первый момент: управление информацией производится на протяжении всего её жизненного цикла — от создания или поступления в организацию до доставки конечному потребителю или уничтожения после окончания срока хранения. Именно эта комплексность подхода позволила ECM выделиться в отдельную отрасль. Информация пронизывает все процессы организации, она создается и обрабатывается в разных информационных системах и при помощи различных приложений, но только ECM делает акцент на том, что должен быть единый подход к управлению информацией на протяжении всего ее жизненного цикла.
И второй момент: ECM — это не только инструменты, то есть информационные системы, но и стратегии и методики управления информацией. Если нет понимания задачи и выработанной стратегии, если не разработаны и не соблюдаются методики, то внедрение ECM-инструментов не сможет решить задач организации. Если нет инструментов, нет технологий, то методики останутся только на бумаге. В этой связке важны все три элемента: стратегии, методики, инструменты.
Можно сделать и еще один вывод: не обязательно, чтобы ECM-задачи в организации решала единая ECM-система. Чаще всего, наоборот, для решения ECM-задач формируется инфраструктура, состоящая из различных аппаратных и программных компонентов, различных технологий и работающая в рамках утвержденной методики.
Технологический парк ECM обширен, он постоянно пополняется новыми технологиями, и ECM-вендоры регулярно предлагают новые решения для уже существующих и новых задач. Кроме того, чтобы адекватно применить или оценить технологию, важно понять ее место в единой задаче управления информацией. Думается, самой наглядной иллюстрацией того, как соотносятся технологии ECM с решаемыми задачами, может служить “дорожная карта”, созданная AIIM. Поэтому мы, не мудрствуя лукаво, в своем рассказе о технологиях ECM также будем двигаться по “ECM-пути”.
Захват (Capture)
На данном этапе жизненного цикла информация создается или импортируется в ECM-систему извне. С этого первого шага начинается движение информации на предприятии, и как следствие возникает задача управления ею. Условно можно выделить два класса информации: создаваемая человеком и создаваемая приложениями. К первому классу относятся бумажные и электронные документы, различные заполненные формы и анкеты, мультимедийная информация (аудио, видео, изображения и т. п.), а также информация на архивных носителях, доставшихся “по наследству”, например, на микрофильмах. Ко второму классу (информация, создаваемая приложениями) относятся данные, выгружаемые из других информационных систем (ERP, CRM, специализированные системы), электронные формы, электронные данные, полученные по каналам электронного обмена.
На этапе захвата используются следующие технологии.
- Сканирование документов. Эта технология позволяет работать в системе с образами бумажных документов, что не только многократно повышает удобство работы, но и делает возможным параллельную и удаленную работу с одними и теми же документами.
- Распознавание образов документов (OCR/HCR/ICR/OMR/IDR). Это целая совокупность технологий, включающая не только оптическое распознавание символов, но и такие “продвинутые” технологии, как интеллектуальное распознавание символов и даже целых документов, распознавание рукопечатных символов (используется при распознавании бумажных форм), распознавание меток.
- Обработка форм. Формы могут быть бумажные, электронные или веб-формы. Заполненные формы пересылаются на участок обработки, где их содержимое заносится в систему.
- Агрегация. Информация может поступать из разных источников, но в ECM-системе она должна быть представлена как логически целая.
- Интеграция. Информация в ECM-систему может поступать из других информационных систем. Интеграционному решению приходится решать массу задач — захват и преобразование данных и метаданных, сохранение юридической значимости информации и т. п.
- Классификация. Полученная информация индексируется, классифицируется и категоризируется, получает регистрационные номера, чтобы в дальнейшем была возможность эту информацию найти, а также на нее ссылаться.
Хранение (Store)
Информация, поступившая в систему, хранится в ней в соответствии с установленными для этого класса информации политиками. Вопросы хранения могут быть рассмотрены на нескольких уровнях абстракции, от физических методов до политик и общей стратегии управления информацией на предприятии. Поэтому в нашем списке используемых технологий также будут присутствовать технологии самого разного уровня:
- SAN (Storage Area Network), NAS (Network Attached Storage), CAS (Content Addressable Storage), магнито-оптические диски, CD/DVD, дисковые и ленточные библиотеки, SSD, RAID. Это целый парк технологий и периферийных устройств, предназначенных для хранения информации. Выбор той или иной технологии обуславливается объемом информации, сроком хранения, параметрами доступа к ней пользователей, требуемым уровнем надежности и безопасности;
- файловые системы, CMS (Content Management System), базы данных, хранилища данных, репозитарии. На этом уровне решаются вопросы организации хранения данных на уровне файлов, записей в базе данных, контента в хранилище и CMS.
Перечисленные технологии призваны решать следующие задачи, возникающие в процессе хранения:
- поиск;
- контроль версий;
- регистрация прибытия/убытия документов и информации;
- блокировка;
- аудит действий пользователей;
- извлечение документов и информации.
На логическом уровне можно выделить управление политиками хранения. Это большая практическая тема, в которой множество подводных камней. Как правильно установить срок хранения, чтобы были соблюдены нормативные требования и учтены интересы бизнеса? Что делать, если одни нормы требуют, чтобы информация была сохранена, а другие — чтобы она была уничтожена? Эти вопросы постоянно приходится решать в организациях, и цена ошибки может быть очень высока.
Обеспечение сохранности (Preserve)
Обеспечение сохранности — это даже не этап, это отдельное направление деятельности, включающее в себя ряд задач:
- обеспечение юридической значимости информации;
- перевод системы в специальные режимы (аудит, проверка и т. п.);
- восстановление информации, пострадавшей в результате катастроф природного и техногенного характера;
- своевременный перевод в новые форматы и на новые носители (это особенно актуально при долговременном хранении информации).
Для решения этих и других задач могут быть использованы различные инструменты и технологии:
- электронная подпись;
- специальные архивные форматы, например PDF-A;
- вывод информации на архивные носители (бумага, микрофильмы);
- резервное копирование и восстановление информации;
- контролируемая конвертация и перенос на другие носители.
Управление (Manage)
Информация, которая обращается в организации и хранится в ECM-системе, только абстрактно представляет собой что-то логически целое. На практике выделяют несколько классов и соответственно несколько отдельных видов деятельности или дисциплин:
- управление документами (Document Management);
- управление информацией, значимой с точки зрения законодательства или бизнеса (Records Management);
- управление цифровыми активами (Digital Asset Management);
- управление электронной почтой (Email Management);
- управление веб-контентом (Web Content Management);
- организация взаимодействия (Collaboration);
- управление бизнес-процессами (Business Process Management, Workflow).
Стоит сразу сказать, что эти задачи могут пересекаться и включать в себя другие, и выделение перечисленных дисциплин носит весьма условный характер.
Аутсорсинг (Outsourcing)
Организации не обязательно делать всё самой, для неё это может быть просто экономически невыгодно. Например, организация может отдать на аутсорсинг хранение документов. В настоящее время нет недостатка в компаниях, предлагающих услугу внеофисного хранения документов. Документы подшиваются в папку, папки складываются в короб, короба хранятся на специальном складе, оборудованном всеми необходимыми средствами (поддержание климата, пожаротушение, автоматическая транспортировка и т. п.). Хранение производится в обезличенных коробах, так что если злоумышленник даже и попадет в хранилище, он не сможет без доступа к внутренней системе определить, где хранятся документы определенной организации.
Для удобства пользования прежде чем документы помещать в короба, их можно отсканировать, а скан-копии передать заказчику или предоставить ему доступ к этим данным. Для оперативной работы используются скан-образы, оригиналы извлекаются из хранилища только в исключительных случаях.
Сюда же можно отнести использование облачных ECM-сервисов, но об этом поговорим отдельно.
Доставка (Delivery)
Хранение информации в ECM-системе — не самоцель, информация постоянно используется в повседневной деятельности. Поэтому в сферу деятельности ECM-систем входит организация ее доставки потребителям. Можно выделить следующие задачи.
- Управление правами доступа. В системе, как правило, хранится информация, предназначенная для разных групп пользователей. Поэтому невозможно представить себе ECM-систему без механизма управления правами доступа.
- Управление отчетами, печатью и публикациями. Результатом ряда бизнес-процессов является бумажный или электронный документ, доступ к другой информации осуществляется через интернет- и интранет-порталы. Либо затребованные документы отправляются электронной почтой или по другим каналам связи. Все эти процессы должны вестись в соответствии с утвержденными методиками и стратегиями.
- Организация доступа с мобильных устройств. Это, наверное, самое динамично развивающееся направление в сфере ECM, так как удаленная и мобильная работа с корпоративной информацией для ряда сотрудников становится уже не вспомогательным, а основным сценарием.
- Межведомственный электронный документооборот (МЭДО). Также одно из динамично развивающихся направлений. Отказ от бумаги и переход на электронный документооборот между организациями помимо того, что даёт экономию на бумаге, печати и расходов на доставку, позволяет организовать совместную работу над документами, увеличить скорость и эффективность взаимодействия.
Для решения этих и других задач используются современные и проверенные временем технологии:
- управление правами доступа к цифровой информации (DRM, Digital Rights Management), “водяные знаки” (Watermark);
- электронная подпись, инфраструктура публичных ключей подписи (PKI, Public Key Infrastructure);
- преобразование (Transformation), форматирование (Format), сжатие (Compression) и объединение (Syndication) информации;
- XML, JSON, SOAP, REST.
Автор статьи — ИТ-аналитик компании DIRECTUM.