По данным компании Gartner, около 90% всей информации, хранимой в корпоративных ИС, является устаревшей или избыточной. Особенно это справедливо для электронной почты, где в почтовых ящиках сотрудников нередко накапливается множество дубликатов массовых рассылок с одинаковыми вложенными файлами. Примерно половина объема сетевых систем хранения занята электронной почтой. Все это усугубляется лавинообразным ростом объемов переписки, существенно усложняющим задачи администрирования и резервного копирования. Одним из решений проблемы считается иерархическое архивирование редко используемой информации и выведение ее из оперативного оборота. Тем не менее и “старая” информация иногда бывает затребована, а потому архив должен быть проиндексирован и классифицирован, с тем чтобы поддерживать операции поиска и извлечения нужного контента. Одна из наиболее востребованных задач такого рода связана с законодательными требованиями ряда стран относительно предоставления полной и детальной информации в ходе аудита или юридических расследований. Согласно Gartner, если не использовать средства автоматизации, затраты на аналитическую работу такого рода в расчете на 1 Гб могут составить около 19 тыс. долл. В начале апреля для решения подобных задач компания EMC представила новую платформу SourceOne.
Пока что в нее входят три продукта, но впоследствии линейку планируется существенно расширить. Сегодня в составе EMC SourceOne есть система архивирования электронной почты SourceOne Email Management (поддерживаются почтовые серверы Microsoft Exchange и IBM Lotus Notes/Domino), средство поиска и извлечения из архива сообщений электронной почты в ответ на юридические запросы или в соответствии с корпоративными политиками рассмотрения претензий SourceOne Discovery Manager и набор разработанных партнерами EMC вспомогательных приложений SourceOne Discovery Collector, автоматизирующих архивирование неструктурированной информации из самых разных источников. В настоящее время в качестве такого источника наряду с упомянутыми почтовыми серверами поддерживается собственная система управления контентом EMC Documentum, но в перспективе планируется распространить эту поддержку на файловые системы, хранилища изображений и отчетов, бизнес-приложения (в частности, SAP) и т. д. Для создания соответствующих программных адаптеров EMC SourceOne предоставляет открытые API-интерфейсы.
В платформе изначально поддерживаются международные кодировки и языки, причем, как заявил директор представительства EMC в России и СНГ по развитию бизнеса в области архивирования и управления контентом Владимир Прожогин, русский язык поддерживается на уровне морфологии. Любопытно в этой связи отметить, что русификация пользовательского интерфейса пока что не осуществлена: обычно на это в EMC уходит около трех месяцев. Поскольку в нашей стране законодательные требования по процедурам открытия информации, аналогичные тем, что применяются в США и ряде других государств, еще не выработаны, полезность модуля SourceOne Discovery Manager в этом отношении не очень велика, но его функциональность, по мнению г-на Прожогина, будет востребована службами безопасности коммерческих компаний.
Следует отметить, что данный продукт появился не на пустом месте. В течение ряда лет EMC выпускала средство архивирования электронной почты EmailXtender, приобретенное ею вместе с компанией Legato в 2004 г. Однако выпуск EMC SourceOne — это не просто смена бренда. Продукт получил заметное развитие в технологическом плане. Если раньше с каждым почтовым сервером мог работать только один сервер архивирования, что существенно ограничивало масштабируемость, то теперь серверы стандартной архитектуры SourceOne легко объединить в кластер, обслуживающий любое число почтовых серверов или иных источников корпоративного контента. Это позволяет легко маневрировать имеющимися вычислительными ресурсами как с целью балансировки нагрузки, так и для повышения отказоустойчивости.
По мнению Владимира Прожогина, EMC SourceOne следует рассматривать как универсальное инфраструктурное решение для архивирования информации. Оно функционирует на промежуточном уровне между источниками контента и системами хранения и открыто для интеграции как “вверх”, в сторону приложений и источников информации, так и “вниз”, к устройствам физического хранения. Впрочем, пока что данный продукт представляет собой программно-аппаратный комплекс, включающий в качестве средств хранения только собственные изделия EMC Celerra и Centera. Как пояснил технический директор российского представительства EMC Игорь Корнетов, сам продукт EMC SourceOne не содержит в себе каких-либо ограничений на используемые системы хранения. Единственное серьезное требование, которому они должны удовлетворять, — это поддержка спецификации eXtensible Access Method (XAM), призванной стандартизировать интерфейсы прикладного программирования между приложениями и системами хранения с контентной адресацией. Данная спецификация одобрена большинством основных поставщиков оборудования.