АНАЛИТИКА
В мире создается и копируется очень много цифровой информации. По оценке аналитической компании IDC, в прошлом году этот показатель составил 161 экзабайт (миллиардов гигабайт), а к 2010-му, по прогнозу, достигнет 988 экзабайт. Более того, данные скоро просто негде будет хранить. Такие сведения приводятся в отчете "The Expanding Digital Universe" (www.emc.com/about/destination/ digital_universe).
Аналитики подсчитали все нули и единицы, из которых состоят фотографии, видео, электронные письма, мгновенные сообщения, телефонные звонки VoIP, результаты медицинских обследований и другой цифровой контент, создаваемый и используемый с помощью электронных устройств, к тому же быстро дешевеющих и находящих все более широкое применение. При этом предполагалось, что в среднем каждый файл копируется три раза. Ведь люди обмениваются цифровыми данными и скачивают их из Интернета.
Конечно, мы записываем далеко не всю информацию. Передачи цифрового телевидения исчезают после просмотра, Web-страницы - вслед за закрытием браузера, а голосовые пакеты - по завершении разговора. Но с другой стороны, при желании все эти данные можно запомнить и хранить сколь угодно долго. Например, многие предприятия по юридическим соображениям оставляют записи телефонных звонков и посещаемых Web-страниц. Но даже если информация уничтожается после использования, до этого она все равно передается по сетям и где-то временно находится. В результате быстро растет нагрузка на сетевую инфраструктуру и системы хранения.
Объем информации и емкость
устройств хранения
Предыдущее исследование такого рода проводилось в университете Беркли в 2003 г. Тогда аналитики оценили всемирный объем данных в 5 экзабайт. Однако в тот раз методика была несколько иной. Так, в Беркли не учитывали копирование файлов, хотя принимали во внимание не только цифровую, но и аналоговую информацию (например, радиопередачи и офисную документацию) после ее перевода в цифровую форму.
Зачем понадобилась новая оценка? По мнению аналитиков, важно понимать причины информационного взрыва. Сейчас примерно 75% цифровой информации создают и копируют индивидуальные пользователи, а 25% - организации. Но к 2010-му доля последних увеличится до 30%, поскольку компьютеры все шире используются на предприятиях малого и среднего бизнеса, требования регулирующих органов ужесточаются (то есть информацию нужно долго хранить), расширяется применение отраслевых приложений (например, средств электронной коммерции, обслуживания клиентов, камер наружного наблюдения и т. д.). При этом растет не только объем информации, но и число контейнеров для ее хранения, т. е. файлов, пакетов и цифровых изображений.
И хотя основной вклад в информационный бум вносят индивидуальные пользователи, за хранение и защиту 85% данных отвечают организации (предприятия, агентства, госучреждения, ассоциации). Это налагает на них серьезные требования с точки зрения управления огромными объемами данных и их защиты.
Цифровая вселенная расширяется неравномерно. На долю развивающихся стран сейчас приходится лишь 10% информации, но этот показатель увеличивается на 30-40% быстрее, чем в Западной Европе, Северной Америке и Японии.
Быстрыми темпами растет объем неструктурированных данных. Уже сейчас цифровые изображения, голосовые пакеты и музыкальные записи составляют 95% всей информации. Но такую информацию очень трудно искать. IDC полагает, что эту проблему можно решить тремя способами: добавлением метаданных, применением средств автоматической классификации (например, распознавания лиц) и разработкой систем доступа, переводящих неструктурированные данные в структурированную форму.
Однако главный результат исследования состоит в том, что уже в нынешнем году объем цифровой информации превысит емкость всех устройств хранения, имеющихся в мире (см. рисунок). Дело в том, что, по прогнозу, до 2010 г. вместимость запоминающего оборудования будет расти ежегодно на 35%, а количество цифровых данных - на 57%.
Проблему усугубляет и сложность управления огромными объемами информации. Ведь чтобы данные приносили пользу, к ним нужно иметь своевременный доступ. Иначе все эти экзабайты уподобятся старым фотографиям, забытым в пыльном чулане. Уже сейчас организации напрасно тратят массу времени при работе с данными. Так, по оценке IDC, предприятие с тысячей сотрудников в среднем ежегодно теряет 5,7 млн. долл. из-за необходимости переформатировать информацию и 5,3 млн. долл. - из-за невозможности ее найти.
Что же делать? По мнению IDC, организациям следует применить комплексный и упорядоченный подход к хранению информации. В частности, стоит обратить внимание на технологию управления жизненным циклом информации (Information Lifecycle Management, ILM). Важное значение имеют и новые технологии виртуализации и сервисно-ориентированного программирования, которые повышают гибкость связей между компьютерами, запоминающими устройствами и приложениями. Такой подход позволяет объединить изолированные информационные островки в единый пул и отделить данные от инфраструктуры их хранения. Но для реализации такой архитектуры предприятия должны по-новому взглянуть на свою ИТ-инфраструктуру, повысить ее динамичность и больше внимания уделить вопросам управления информацией.