За последние 20 лет потребности в СХД и сами технологии хранения данных сильно изменились, поэтому предприятиям имеет смысл внедрять ИТ-стратегию, согласованную с общим планированием ИТ-архитектуры, советует на портале InformationWeek президент консалтинговой компании Transworld Data Мэри Шеклет.

Хранение данных должно быть стратегической ИТ-задачей, но существует много причин, почему это не так. Во-первых, СХД сравнительно дешевы, и если предприятию потребуется в течение бюджетного года нарастить объем хранилища, то это не составит большого труда. Во-вторых, стоимость СХД часто включается в новые системы, которые приобретает ИТ-отдел, поэтому она не слишком заметна. В-третьих, когда ИТ-отделу необходимо масштабировать инфраструктуру или операции, речь в первую очередь идет о системах и сетях, тогда как СХД обсуждают гораздо реже. Тем не менее, управление данными играет важную роль в ИТ-проектах, поэтому нужно понимать, что давление на СХД огромно и оно начинается с разносторонней (и новой) роли в ИТ-архитектуре.

На самом базовом уровне хранилище встраивается в некоторые SoC (системы на кристалле), которые используются для периферийных вычислений, или в чипы, содержащие оперативную память. Самый распространенный пример — смартфон, но это могут быть и другие периферийные устройства. Следующий уровень хранения — сети SAN и NAS, которые применяются и на периферии, и в централизованных дата-центрах. В этих конфигурациях хранилище может отображаться как обычный диск или как файловый сервер. Независимо от способа реализации, хранилище данных должно быть реализовано в зависимости от типов приложений в сети, которую оно поддерживает.

Далее идет крупномасштабный уровень хранения данных в ЦОДах и в облаке, и иерархия хранения данных, которая варьируется от очень медленных, «холодных» дисков (для редко используемых данных) до хранилищ типа in-memory и на базе SSD, используемых для быстрой обработки транзакций в высоконагруженных средах, работающих в режиме реального времени.

«Наличие хорошей стратегии хранения данных больше не является роскошью для современных организаций, — считает Кал Рана, старший архитектор решений компании vxchange. — Управление хранением данных важно как никогда — в основном потому, что способность извлекать из данных действенные инсайты часто является ключевым фактором успеха бизнеса. Стратегия хранения данных не только определяет, как компания хранит свои данные, но и как она использует эту информацию».

Рассмотрим, как цифровизация, быстрота анализа, скорость обработки транзакций и безопасность влияют на хранение данных, и почему оно должно быть стратегическим направлением ИТ. Ниже приводятся четыре элемента современной стратегии хранения данных:

1. Скорость vs. стоимость

Насколько хорошо вы знаете свои способы применения данных? Ключом к оптимизации хранения и общей производительности ИТ является знание того, какие данные используются на предприятии чаще всего, какие данные требуется найти быстро, а какие используются редко или умеренно часто.

Более дорогие СХД типа in-memory и All-flash следует зарезервировать для самых важных данных, к которым часто обращаются и к которым нужен быстрый доступ. С другой стороны, данные, к которым обращаются редко, должны храниться на дешевых дисках для «холодного» хранения. Между этими двумя крайностями находятся данные, к которым обращаются умеренно часто, но которые не требуют быстрой обработки в реальном времени. Такие данные можно хранить на носителях, которые позволяют получать доступ и извлекать данные c умеренной скоростью.

Стремление организовать данные и приложения таким образом является важным элементом стратегии хранения, гарантирующей оптимальную производительность при минимальных затратах.

2. Соответствие инфраструктуры

Насколько хорошо ваши системы хранения данных сочетаются с общей ИТ-инфраструктурой? Все больше организаций переносят приложения (и системы хранения) в облако, что ослабляет контроль за планированием и распределением хранилищ, поскольку развертывание облачного хранилища может быть выполнено буквально одним нажатием кнопки и кем угодно. Это приводит к нерациональному использованию, а также к выбору неправильных типов хранилищ для приложений. Некоторые предприятия допускают нецелевое применение хранилищ в своих ЦОДах, но эта вероятность гораздо ниже, чем в облаке, потому что за непосредственный контроль использования и развертывания хранилищ там несет ответственность ИТ-отдел.

3. Ликвидация простаивающих ресурсов

Десять лет назад компании начали переносить свои тестовые площадки для ИТ-приложений в облако, потому что задействовать для проведения ИТ-тестирования своими силами виртуальные серверы ОС и хранилища проще, чем внутренние ИТ-ресурсы (например, группу баз данных). В итоге они получили значительную экономию человеко-часов в ЦОДах, но обратной стороной этих преимуществ стал избыток серверов и хранилищ, которые остаются развернутыми (и оплаченными) в облаке еще долгое время после завершения тестов по причине того, что разработчики забывают их удалить.

Еще одним источником проблем является хранение ненужной информации. В некоторых случаях хранение старых данных необходимо, например, для документов, которые могут понадобиться в судебном расследовании. Однако в большинстве случаев ИТ-отдел не проводит ежегодные совещания, чтобы решить, какие данные необходимо хранить, а от каких можно отказаться.

Третья область нерационального использования хранилищ — это беспорядочный прием всех поступающих данных без проверки их на актуальность. Одним из примеров является хранение данных IoT, которые не были отфильтрованы на предмет машинного шума. Другой пример — хранение данных, которые не были подготовлены с помощью таких методов, как очистка и дедупликация данных.

Согласно исследованию компании Domo, в среднем встречи в Microsoft Teams ежедневно проводят 52 тыс. человек и в Zoom — 280 тыс., а пользователи WhatsApp отправляют 41,7 млн. сообщений. При таком объеме производства данных ИТ-отдел обязан разработать стратегии хранения, направленные на обеспечение их сохранности, а также определить, какие данные следует вообще исключить.

4. Безопасность

Утечки данных и компрометация хранилищ — это угроза карьере ИТ-менеджеров и бренду компании.

Нарушения безопасности данных могут происходить двумя основными способами:

  • сотрудники компании хранят данные на жестких дисках рабочих станций и обмениваются ими, о чем ИТ-отдел не знает; или сотрудники уносят их на флешках или других устройствах, которыми можно обмениваться;
  • облачные провайдеры, размещающие корпоративные данные, не обеспечивают строгую защиту, и данные становятся доступными.

Что касается данных сотрудников, то сейчас многие компании хранят все данные на корпоративных серверах, а их сотрудники пользуются тонкими клиентами. Компании также используют ПО для отслеживания данных, которое может обнаружить, когда сотрудник пытается загрузить данные на флешку или другое устройство. Это препятствует возможности хранить данные на собственных устройствах.

Вторая область риска — это то, что происходит с данными, которые хранятся в облаке. Следует ежегодно запрашивать аудиты безопасности у поставщиков облачных услуг, чтобы ИТ-отдел мог проверить безопасность облака.

При заключении контрактов с облачными провайдерами базовым условием должно быть выполнение корпоративных требований к безопасности данных и их хранению.

Наконец, для компаний, использующих многопользовательский подход в облаке, где ресурсы используются совместно, очень важно убедиться, что приложения, данные и хранилища одной компании всегда защищены и отгорожены от данных, хранилищ и приложений других компаний.