По данным компании IDC, только в 2006 г. было создано и растиражировано 161 млрд. гигабайт (161 экзабайт) цифрового контента. Это в три миллиона раз превышает объем информации, заключенной во всех когда-либо написанных книгах”, — заявил глава корпорации EMC Джо Туччи на конференции EMC World ‘2007 в Орландо. Даже приняв во внимание не совсем корректное смешение таких понятий, как объем данных и содержание в них полезной информации, следует с грустью констатировать, что на фоне "большого информационного взрыва” огромная часть научного и культурного наследия по-прежнему остается не оцифрованной, а потому практически недоступной большинству людей.
Объявленная на конференции инициатива EMC Information Heritage Initiative, предполагающая спонсирование со стороны EMC подобных программ во всем мире, хоть и несет вполне понятную маркетинговую нагрузку, заслуживает самого серьезного одобрения. Ведь если ситуация с цифровыми архивами исторического наследия не претерпит существенных изменений и к 2010 г., когда, как полагают в IDC, будет генерироваться уже 988 экзабайт данных, стыдиться своей неразумности придется всему человечеству.
Столь динамичный рост объемов цифровой информации (в среднем на 60% в год) ставит перед отраслью новые серьезные задачи. И главная проблема будет состоять не в том, где хранить информацию, а как это делать наилучшим образом. Вице-президент EMC по разработкам Марк Льюис очерчивает круг основных проблемы, стоящих перед предприятиями и частными лицами, следующим образом: “Как мне заработать больше денег, используя накопленные данные? Как эти данные наиболее экономно хранить? И как при этом не угодить в тюрьму?”. Последнее сказано вовсе не для красного словца: с каждым годом растет число нормативных актов, о соблюдении которых нужно заботиться самым серьезным образом. Мы в своих публикациях чаще всего упоминаем стандарты Basel II и Sarbanes -- Oxley, но в реальной жизни количество руководящих документов такого рода исчисляется сотнями.
Информационная инфраструктура
На каком уровне должны контролироваться доступ к подобным документам и регламенты работы с ними? Нередко это делается (а иногда и не делается) в каждом приложении, обращающемся к соответствующим данным. В EMC такой подход считают принципиально неверным и предлагают управлять информацией независимо от того, какие приложения (а их на одном предприятии могут быть десятки и даже сотни) ее используют и обрабатывают. Для этого собственно и необходима информационная инфраструктура, развитие и продвижение которой находилось в центре внимания конференции. Были на ней, разумеется, и анонсы новых продуктов (см. PC Week/RE Review, июнь 2007 г.).
Пропагандируя концепцию информационной инфраструктуры, руководители EMC попутно решают и другую задачу. В последнее время компания стала одним из самых активных в ИТ-отрасли игроков на рынке слияний и поглощений: за несколько лет ею приобретено более тридцати фирм разного масштаба. Далеко не всем экспертам понятна такая “прожорливость”. На пресс-брифинге г-ну Туччи даже намекали на сходство в этом отношении с Computer Associates, скупавшей некогда поставщиков ПО впрок без особого разбора. И хотя в данном случае глава EMC отшутился, выразив надежду, что сходство не такое уж полное (видимо, намекая на болезненные проблемы CA с финансовыми органами США), необходимость в подобной разъяснительной работе ни у кого не вызывает сомнений.
Сегодня для многих компаний информация становится чуть ли не основным активом. Но часто ли можно четко указать, кто несет за нее ответственность? “Ведь с деньгами ситуация совершенно иная, — удивляется вице-президент EMC по технологическим альянсам Чак Холлис. — Здесь мы понимаем, что спрашивать нужно с финансового директора. Он знает, откуда деньги поступили, где они находятся сейчас, как их сберечь и каким образом использовать с наибольшей выгодой для предприятия. Но попробуйте спросить CIO, знает ли он, где расположена вся корпоративная информация, защищена ли она должным образом, оптимально ли хранится и в полной ли мере используется для получения прибыли”.
И судя по всему, вопросы эти никуда не денутся, как бы ни менялись условия работы компании: можно переехать в другой офис, обновить оборудование, отдать какие-то задачи на аутсорсинг, но информация всегда останется с вами. Следует признать, что контролируется она не очень хорошо и довольно бессистемно: зачастую по отдельности осуществляется управление файлами, почтовыми сообщениями, транзакционными данными и т. д. Это приводит к излишним затратам и чревато дополнительными рисками. Да и использовать информацию с максимальной выгодой для бизнеса в такой ситуации затруднительно. На помощь должна прийти инфраструктура, рассматриваемая как совокупность сервисов для хранения информации, ее защиты и оптимального размещения, которые предоставляются независимо от того, где она возникает и где используется. Будь то информация о клиентах или продуктах, создается она, как правило, в одном месте, а находит применение во множестве других. Именно поэтому она должна быть выведена из-под контроля какого-то одного подразделения или приложения.
Что есть в арсенале EMC
Пожалуй, дальше всего на этом направлении EMC продвинулась в сегменте систем хранения: они уже сегодня не привязаны к конкретным приложениям, серверам или сетям. Тем не менее развитие не останавливается и здесь. Все большую популярность приобретают конвергентные сети на базе протоколов Ethernet и IP, служащие одновременно и для передачи данных, и для консолидации систем хранения. Другая "горячая" технология - дедупликация данных. Не секрет, что огромные объемы хранящейся ныне информации содержат множество дубликатов целых файлов или их фрагментов. Избыточность при этом огромна: к примеру, представленная на конференции новая версия продукта EMC Avamar 3.7 (приобретенного ею недавно вместе с фирмой Avamar) позволяет серьёзно сократить время резервного копирования данных, контролируемых виртуальной машиной VMware, иногда на 90%.
Но информацию мало сохранить на диске, ее нужно еще и защитить -- от исчезновения и от несанкционированного доступа. Первая задача традиционно решается с помощью средств архивирования и резервного копирования. К ним в последнее время все чаще относят и инструменты непрерывной защиты данных (Continuous Data Protection, CDP), позволяющие восстанавливать состояние информации на любой момент времени в прошлом. EMC предлагает для этого продукт Recover Point. Вторую задачу традиционно решали путем защиты сетей, баз данных, серверов, мобильных устройств -- то есть технологической инфраструктуры, а не самой информации.
В результате злоумышленник может использовать малейшую брешь, чтобы вынести с предприятия ценные сведения на обычной флэшке. Как полагают в EMC, решить указанную проблему можно, объединив технологии управления цифровыми правами и идентификацией пользователей. В этом случае доступ к информации, содержащейся в любом файле, где бы он ни находился, будет предоставляться лишь тем, кто имеет на то вполне определенные полномочия. Для развития данного направления корпорацией EMC в свое время была куплена компания RSA Security.
Но допустим, информация хорошо защищена. Как использовать ее наиболее оптимальным образом? Для этого сначала нужно понять, что на самом деле хранится в корпоративных архивах. Мы должны видеть не просто обезличенные файлы или почтовые ящики, а стоящие за ними содержательные данные. Только исходя из этого можно принимать решение об удалении того или иного файла, о перемещении его на другой носитель, о применении к нему политики индексирования, шифрования, резервного копирования и архивирования. Одним из первых инструментов такого рода в арсенале EMC стал продукт Email Extender.
Не менее полезное средство InfoScape -- способно автоматически обследовать все имеющиеся в компании файл-серверы на предмет наличия на них устаревших, мало используемых, плохо защищенных и т. д. файлов. Как рассказал Чак Холлис, в некоем американском банке применение InfoScape позволило обнаружить 12 файл-серверов, о существовании которых айтишники просто забыли, а около 8 тыс. документов, находившихся там в открытом доступе, содержали конфиденциальную информацию о клиентах кредитного учреждения. Огромные перспективы в области оптимизации информационной инфраструктуры сулит технология виртуализации, позволяющая гибко распределять ресурсы серверов и систем хранения между приложениями, которые эксплуатируются на предприятии. Лидер этого рынка фирма VMware стала ценнейшим приобретением EMC за последние годы.
Для конечного пользователя критерием оптимальности инфраструктуры служит уровень предоставляемого ему сервиса (SLA). Контроль SLA — еще одна область, в которой довольно успешно работает сегодня EMC. Конкуренция здесь весьма велика: на этом рынке давно и успешно действуют такие гиганты, как IBM (Tivoli), Hewlett-Packard (OpenView), CA (Unicenter). Тем не менее, как считают в EMC, компании удалось создать ряд инновационных решений, позволяющих в оперативном режиме осуществлять мониторинг ИТ-активов (продукт End Layers) и с помощью корреляционного анализа находить первопричины проблем и нештатных ситуаций (Smarts).
Когда речь заходит о том, как сделать информацию по-настоящему ценным активом предприятия, нужен более глубокий взгляд на нее. В этом случае следует говорить уже не просто о дисках, файлах и блоках, а о реальном смысловом содержании хранимых объектов (контенте). В качестве платформы для решения подобных задач корпорация EMC предлагает сегодня продукт Documentum, также купленный ею в свое время вместе с одноименной компанией.
Начав свою эволюцию как популярное средство управления документами, сегодня он представляет собой мощную платформу для формирования архивов, коллективной работы, обеспечения нормативных требований, управления контентом и бизнес-процессами, основанными на документообороте. Говоря о перспективах развития продукта, старший вице-президент EMC по технологиям управления контентом и архивирования Баладжи Еламанчили анонсировал выпуск на его основе специализированных пакетов (Integrated Solution Suite) для работы аналитиков, управления транзакционными процессами, обеспечения интерактивного взаимодействия с контентом, архивирования и соблюдения нормативных требований.
Если учесть, что контент сегодня - это далеко не только текстовые документы, но и изображения, аудио- и видеозаписи, географические карты, трехмерные модели САПР, на первый план выходит задача формирования и использования соответствующих репозиториев метаданных. Как пояснил г-н Еламанчили, ее решение не по силам одной EMC: основную нагрузку должны взять на себя партнеры. Другое дело — интеграция подобных репозиториев, которая в рамках технологии Repository Virtualization станет основой концепции ECM 2.0 (Enterprise Content Management). Остальные ее составляющие — это архитектура SOA, развитые аналитические инструменты и компоненты Web 2.0 (блоги, Wiki, полнофункциональные Web-клиенты). Первым решением, в котором нашли применение идеи ECM 2.0, стала представленная на конференции новая версия продукта Documentum 6.
Что впереди
Не были обойдены вниманием и иные модные концепции. Одна из них SaaS, которую в EMC расшифровывают и как Software as a Service, и как Storage as a Service, -- будет продвигаться не просто в виде услуги удаленного хранения данных, а в форме комплексного сервиса Data Vault, включающего их резервное копирование, архивирование, индексирование и контроль соблюдения всех требований законодательства. При этом клиенту не придется покупать никакого программного и аппаратного обеспечения, а в контракте он может зафиксировать свои требования к уровню сервиса. Пока что эта услуга не реализована.
Джо Туччи не исключает также прихода EMC на массовый рынок, который ранее компания обходила стороной. "Хотя конкретные решения и не приняты, мы думаем об этом, — сказал он. — Я полагаю, в домах вскоре вполне могут появиться небольшие дисковые массивы, способные хранить более терабайта данных. Самое сложное здесь в том, чтобы выбрать адекватную бизнес-модель. У EMC нет опыта работы на массовом рынке, а потому нам либо придется развивать данную практику у себя, либо, как это делает Intel, встраивать свои технологии в решения партнеров".
Возвращаясь к упомянутой выше инициативе EMC по сохранению исторического наследия путем его оцифровывания, хотелось бы подчеркнуть, что наряду с крупным грантом стоимостью 1 млн. долл., доставшимся Смитсоновскому институту, компания предлагает и ряд небольших -- объемом от 5 до 15 тыс. долл., которыми может воспользоваться общественная организация, институт или частное лицо из любой страны мира, включая и Россию. Условия опубликованы на сайте www.EMC.com/heritage_trust.