ТЕХНОЛОГИИ
и помогает компаниям справиться со сложными задачами управления данными на протяжении всего периода их использования
Управление хранением данных не сводится к заготовке емких резервуаров для складирования битов. И существует немало факторов, включая федеральные нормы и постоянную необходимость в сокращении затрат, которые заставляют ИТ-менеджеров из самых разных секторов индустрии пересматривать свою политику, связанную с аккумулированием и сроками хранения информации.
Управление жизненным циклом данных (data life-cycle management, DLM) представляет собой новейшую технологию, предлагаемую для решения все более сложных проблем хранения информации.
Попросту говоря, DLM-продукты помогают ИТ-департаментам управлять данными на протяжении всего периода их использования. В перспективе DLM станет одной из важнейших задач информационной технологии, так как ее решение позволит ИТ-отделам оптимально использовать ценные ресурсы памяти, одновременно поддерживая сохранность, доступность и защищенность информации. Эффективные DLM-решения также помогают ИТ-специалистам идентифицировать статистику обращения к данным и автоматизировать процессы их перемещения, защиты и архивирования.
Пользователи понимают огромные выгоды реализации DLM-решений, считает Крис Вуд, директор по маркетингу и техническому обеспечению сбыта подразделения Sun Network Storage фирмы Sun Microsystems: "Они убеждаются, что освобождение от излишних, устаревших или маловажных данных позволяет значительно уменьшить затраты как на приобретение памяти, так и на ее последующее администрирование. Чем меньше объем базовых данных, которыми нужно управлять, тем меньше объем административных забот, а это напрямую снижает общую стоимость владения ресурсами".
Система хранения DeLorme охватывает весь жизненный цикл данных
DLM-стратегия ведущей картаграфической компании поддеривает готовность данных
Одним из основных мотивов для реализации DLM-решений является необходимость соблюдения регулятивных правил. Как считает Ховард Элиас, исполнительный вице-президент по корпоративному маркетингу и новым предприятиям корпорации EMC (Хопкинтон, шт. Массачусетс): "Сегодня в мире, по некоторым оценкам, насчитывается свыше 20 тыс. нормативных актов, прямо или косвенно воздействующих на управление информацией. Даже сам учет всех существующих норм и оценка их приложимости к конкретной ситуации нередко является серьезной и непростой задачей, особенно в таких регулируемых отраслях, как финансовое обслуживание и здравоохранение".
На нынешнем рынке DLM-продуктов одновременно представлены и более старые, перекроенные технологии, как, например, HSM-системы (системы иерархического управления хранением), и те, что поновее, - к ним относятся WORM-устройства уровня файловой системы и вторичные (nearline) ATA-устройства хранения данных.
Общая черта DLM-решений - использование ранжированных уровней памяти и наличие средств, упрощающих перемещение данных с одного уровня на другой. Логика уровней памяти состоит в том, что с устареванием информации и более редким обращением к данным их следует переносить на менее дорогостоящие устройства хранения.
Примером первичного уровня памяти являются системы хранения с технологией Fibre Channel, имеющие наилучшее быстродействие, но одновременно и наивысшую стоимость из расчета цены хранения каждого мегабайта - в несколько раз больше, чем при простом архивировании на лентах. Перевод устаревших данных с первичного уровня на вторичное устройство хранения или в долговременный архив, скажем, в массивы ATA-дисков, библиотеки на оптических носителях или ленточные хранилища, может сэкономить немало денег.
Что тут нового? Хотя идея уровней памяти немолода и обычно ассоциируется с HSM-продуктами, DLM-решения обладают функциями, которые отвечают на сегодняшние запросы бизнеса.
"DLM помогает пользователям сконцентрировать внимание на обоснованной политике хранения данных и управления его сроками и как результат на разумном размещении разнообразных категорий электронных документов и неструктурированных данных, - говорит вице-президент по маркетингу продуктов и решений корпорации Veritas Software (Маунтин-Вью, шт. Калифорния) Бренда Завацки. - Кроме того, пользователи видят, что DLM-решения, позволяющие соблюдать нормативные инструкции на базе прежних инвестиций в управление данными, экономически выгодны".
DLM на практике
По словам Марка Уарда, вице-президента и главного управляющего подразделения Information Lifecycle Management Solutions (Луисвилл, шт. Колорадо) корпорации Storage Technology, HSM-системы, как правило, одномерны - в том смысле, что перемещение данных в них определяется временем, прошедшим с момента последнего обращения к информации. Однако в сегодняшней бизнес-среде информация должна перемещаться проактивно, с прицелом, например, на предстоящий квартальный отчет или нормативные сроки хранения данных.
"HSM-решения не вызывали ожидаемого интереса рынка"
Карен Датч |
Хотя HSM-технологии существуют не один год, они никогда не были популярны в среде открытых систем (в отличие от среды мэйнфреймов, где они весьма распространены).
"HSM-решения, особенно в открытых системах, не привлекли ожидаемого интереса рынка, - считает Карен Датч, вице-президент по управлению продуктами корпорации Fujitsu Software Technology (Саннивейл, шт. Калифорния). - В среде продуктов разных производителей у HSM имеется ряд врожденных проблем. Управление решением с символическими ссылками или программными заглушками часто отнимает массу времени и чревато всевозможными сбоями. В силу этих ограничений масштабируемость HSM-систем вызывает серьезные сомнения".
Недавнее появление недорогих ATA-систем дисковой памяти создает новую базу для вторичного уровня хранения данных, привлекательную для тех ИТ-менеджеров, которым неудобны решения с использованием оптических дисков или ленты.
Как утверждает Майкл Марчи, старший директор по корпоративному маркетингу фирмы Network Appliance (Дурхам, шт. Сев. Каролина), клиенты NetApp развертывают ATA-системы в качестве вспомогательных к своей основной памяти. Такая стратегия приносит значительные дивиденды, так как ATA обеспечивает недорогой и быстрый способ онлайнового доступа к данным без задержек и неудобств, которые связаны с лентой.
Производители проводят различия между DLM и ILM |
В прессе и маркетинговых материалах термины "управление жизненным циклом данных" (DLM) и "управление жизненным циклом информации" (ILM) часто используются один взамен другого. Однако некоторые производители создают прецедент для разделения и закрепления их самостоятельных дефиниций. Такие корпорации, как EMC и Fujitsu Software Technology, видят в ILM надмножество DLM, считая, что ILM вносит в процесс управления дополнительную интеллектуальность. По мнению Карен Датч, вице-президента Fujitsu Softek по управлению продуктами, DLM концептуально проще, чем ILM, и концентрируется на общих характеристиках данных - их возрасте, объеме и типе файлов - без детального знания приложений. ILM же, полагает Датч, относится к понятиям более высокого уровня: предполагая осведомленность в значении информации, связанной с любой порцией данных, оно требует интеллектуальности, касающейся прикладного контекста информации. В этих компаниях считают, что ILM-решения, в отличие от DLM, выходят за уровень файлов и рассматривают не сами файлы, а их контент. Например, при наличии DLM-решения легко можно найти файл (будь то электронная таблица, письмо или счет), если известно его имя. Однако поиск данных внутри файлов (скажем, розыски конкретного номера счета или названия компании при проведении аудита) требует интеллектуальности, которой обладают лишь инструменты ILM. У всех предприятий растут горы неструктурированных данных, и пользователям становится необычайно трудно прочесывать файлы для отыскания данных. ILM предоставляет ИТ-менеджерам и пользователям возможность вести поиск нужного контента в репозиториях данных. В прошлом главными объектами внимания ИТ-менеджеров при покупке памяти были скорость, емкость и простота устранения отказов, но сегодня ставки поднялись. Производители памяти должны приобретать или разрабатывать новые технологии, чтобы встраивать в свои системы возможности сбора и анализа информации. Мы уже сталкивались с такими случаями, когда производитель памяти покупал компанию, специализирующуюся на управлении документами и управлении знаниями (например, EMC, приобретшая фирму Documentum). По мере разработки продуктов и технологий в контексте ILM мы увидим новые примеры таких приобретений и партнерской кооперации.
Генри Балтазар |
"Решения NetApp с ярусным перемещением данных способствовали широкому распространению вторичной памяти. Важно отметить, что для достижения необходимого уровня производительности и надежности критическую роль играет ПО, связанное с ATA-массивами. Покупка обычной ATA-системы без дополнительного ПО гарантирует полную неудачу", - пояснил Марчи.
Еще одна новая концепция состоит в применении WORM-технологий к памяти на магнитных дисках, что делает их пригодными для долгосрочного архивирования.
Для представителей eWeek Labs, беседовавших с руководством производителей подсистем памяти, не было ничего удивительного в том, что поставщики ленточных решений (включая StorageTek и Hewlett-Packard) оказались гораздо меньше заинтересованы в использовании для архивирования жестких дисков, чем вендоры, концентрирующие основное внимание на дисках, например, NetApp и EMC.
Некоторые эксперты в области памяти и производители, традиционно занимающиеся дисковыми технологиями хранения, уже много лет пророчат вымирание ленты, однако рынок упорно доказывает их неправоту. Покупательский спрос на ленточные решения велик, и, в частности, HP не думает, что в ближайшем будущем здесь возможны перемены. "Для пользователей лента остается важным носителем", - уверен директор ILM-подразделения HP Расти Смит.
По мнению eWeek Labs, лента будет использоваться еще многие годы, поскольку сегодня это зрелая и проверенная технология памяти на съемных носителях.
Ожидаемые препятствия
В перспективе исключительно важно разработать открытые стандарты DLM и ILM. (Разница между этими технологиями обсуждается во врезке.) Большинство нынешних DLM-решений в основном носит фирменный характер, что очень отпугивает многих ИТ-менеджеров, так как в отсутствие общеотраслевых стандартов есть риск замкнуться на единственном поставщике.
Представители всех компаний, с которыми мы беседовали, выразили полное одобрение идеи открытых стандартов и готовность к взаимному сотрудничеству для усиления своих DLM-решений. Будет интересно все это увидеть на деле, так как производители пытаются балансировать между нуждами пользователей и собственными рыночными интересами.
Учитывая, что для достижения приемлемого уровня совместимости SAN-продуктов потребовался не один год, а стандарты управления памятью разрабатываются довольно медленно, мы думаем, что для стандартизации DLM-процессов, если это вообще случится, понадобится несколько лет. Однако в будущих партнерствах между производителями можно не сомневаться.
ИТ-менеджерам следует присматриваться к деятельности технической рабочей группы Object-Based Storage Devices (OSD, бывшая OBSD) (www.snia.org/tech_activities/workgroups/osd). Эта организация предлагает стандарты для следующего поколения устройств памяти, которые со временем смогут работать с данными как с объектами, вместо того чтобы элементарно представлять их в виде блоков и файлов. С прогрессом объектной концепции хранения данных устройства памяти смогут решать такие задачи DLM, как идентификация данных и автоматическая установка политик.
"Многоуровневые решения NetApp способствовали широкому распространению вторичной памяти"
Майкл Мрчи |
Заслуживают внимания и инструменты уровня приложений, позволяющие ИТ-администраторам выводить из баз данных старую информацию, избавляя серверы от ненужного груза. Интересные продукты уровня приложений имеют фирмы Embarcadero Technologies и Princeton Sof-tech, и их роль со временем будет возрастать, так как базы данных наполняются все большим количеством информации.
Принципы реализации
Развертывая любую новую технологию, ИТ-менеджеры должны четко сознавать, что они затевают, но это особенно важно при реализации DLM-решений. Компания может время от времени обновлять свое сетевое и серверное оборудование и ПО, однако подсистемы памяти обслуживают бизнес годами, а то и десятилетиями.
У ИТ-администраторов бывает искушение сделать что-то на скорую руку, чтобы, например, облегчить соблюдение нормативных актов, однако развертывание системы без полного понимания ее отрицательных и положительных воздействий на бизнес никогда не сулило ничего хорошего.
DLM - не такая вещь, которую можно купить в одном продукте. Чтобы получить от DLM максимальный эффект, ИТ-менеджерам надо досконально знать свои бизнес-процессы. С помощью средств управления ресурсами памяти или проверяя протоколы событий приложений можно составить понятие об объеме накопившейся устаревшей информации и получить реалистичную картину роста количества данных.
Ключом к успешной реализации DLM является баланс между затратами и эффектом для бизнеса.
Если перестараться с переводом данных из первичных хранилищ на более медленные уровни памяти, то пользователям придется подолгу ждать извлечения нужной информации, и этот негативный эффект может привести даже к большим издержкам, чем покупка лишних резервов основной памяти и редкий перенос данных.
Например, учитывая собственный опыт с замедлением доступа, отделение NASA Advanced Supercomputing решило не переносить файлы небольших размеров, а постоянно держать их в первичной памяти, так как пользователям совсем не хочется тратить время на извлечение мелких файлов. (Очерк Labs On-Site о реализации DLM в этом подразделении NASA можно найти на странице www.eweek.com/labslinks.) Далее, ИТ-менеджерам не следует рассчитывать на быстрые темпы развертывания DLM-решений. Даже после того как будут сконфигурированы все компоненты DLM-системы, понадобятся недели, если не месяцы, на оптимизацию всех политик.
ИТ-отделам необходимо запланировать проведение всестороннего тренд-анализа, чтобы проследить за поведением DLM-компонентов и соответственно отрегулировать системы.
Еще один аспект реализации DLM-решений связан с безопасностью. Поскольку в этих решениях обычно создается много копий данных на разных уровнях памяти, важно обеспечить защиту каждого репозитория данных в DLM-системе.
Так, съемные носители, например ленты, должны иметь криптозащиту, чтобы предотвратить утечку данных в случае кражи кассет из компьютерного зала или при их транспортировке.
К числу производителей, выпускающих полезные устройства аппаратного шифрования для защиты ленточных данных, относятся фирмы Decru и NeoScale Systems.
Никто не спорит, что DLM-технологии сложны для реализации, особенно в экономически трудное время. Но если все сделать правильно, ИТ-отделы смогут обеспечить долгосрочную экономию средств.
Со старшим аналитиком Генри Балтазаром можно связаться по адресу: henry_baltazar@ziffdavis.com.
На странице www.eweek.com/labslinks можно найти ответы производителей памяти на вопросы eWeek Labs по технологии DLM.