В связи с растущим спросом на использование данных для аналитики и искусственного интеллекта необходимость в правильном хранении данных становится как никогда актуальной, пишет на портале eWeek Кришна Субраманиан, операционный директор и президент компании Komprise.
Технологии хранения данных развиваются, предлагая все больше вариантов и опций для различных сценариев использования, — например, сегодня актуальными являются хранилища с поддержкой ИИ-нагрузок, — поэтому определение правильного пути обновления СХД требует подхода, основанного на данных.
При принятии решения о создании нового хранилища данных необходимо также учитывать потребности пользователей и бизнеса в отношении производительности, доступности и безопасности. По данным Forrester, 83% лиц, принимающих решения, не могут эффективно использовать данные из-за таких проблем, как устаревшая инфраструктура, перегруженность команд, утопающих в данных, и отсутствие эффективного управления данными в разрозненных локальных и облачных хранилищах. Еще одним важным моментом является использование облачных хранилищ и облачных вычислений, где технологии ИИ и машинного обучения развиваются быстрее всего.
Учитывая беспрецедентный рост объема неструктурированных данных и растущую потребность в этих данных для аналитических выводов и ИИ, как никогда важно правильно их использовать. В этой статье мы расскажем о том, чего не следует делать при обновлении хранилища данных.
Ошибка 1. Принятие решений без целостной картины данных
Когда ИТ-менеджеры обнаруживают, что им требуется дополнительное хранилище, легко просто купить больше, чем нужно. Однако впоследствии это может привести к напрасным тратам и/или неправильному выбору технологии хранения.
Большинство данных (80%), как правило, «холодные» и не используются в течение нескольких месяцев с момента создания, но при этом расходуют дорогостоящие ресурсы хранения и резервного копирования. Кроме того, если учесть, что в настоящее время можно мгновенно и по требованию приобретать дополнительные емкости в облаке и при использовании модели «хранилище как сервис» онпремис, то нет никаких оснований для избыточного резервирования.
Чтобы избежать этой распространенной проблемы, необходимо получить информацию обо всех данных во всех средах хранения. Выясните объемы данных, темпы их роста, стоимость хранения и то, как быстро данные стареют и становятся пригодными для архивирования или создания озера данных для будущего анализа.
Эти базовые показатели, особенно в сочетании с инструментом FinOps для моделирования стоимости различных вариантов, помогут принять более точные решения. Необходимость управления растущими объемами неструктурированных данных в различных технологиях и средах для различных целей приводит к переходу к принятию решений по ИТ-инфраструктуре, ориентированных на данные, а не на хранение.
Ошибка 2. Выбор универсальной системы хранения данных
Решения для хранения данных могут быть самыми разными — от облачных объектных хранилищ до all-flash NAS, масштабируемых онпремисных систем, массивов SAN и т. д. Каждый тип СХД предлагает различные компромиссы в отношении стоимости, производительности и безопасности.
В результате для различных рабочих нагрузок лучше всего подходят разные типы хранилищ. Например, для локальных приложений, обрабатывающих конфиденциальные данные, безопасность проще обеспечить с помощью онпремисного хранилища, а для приложений с непредсказуемыми требованиями к хранению лучше использовать облачное хранилище с возможностью быстрого масштабирования.
Это еще раз указывает на необходимость анализа, сегментирования и понимания данных. Возможность поиска данных по типам файлов или тегам метаданных позволяет идентифицировать данные и лучше управлять ими. Избегайте универсального подхода, используя для хранения данных несколько типов решений, отражающих различные потребности.
Кроме того, на хранение приходится менее 25% стоимости данных: основная часть затрат здесь связана с постоянным резервным копированием, аварийным восстановлением и защитой данных. Поэтому необходимо правильно выбрать тип и уровень хранения, а также соответствующие механизмы защиты данных на протяжении всего их жизненного цикла.
Ошибка 3. Привязка к одному поставщику
Приобретение всех систем хранения у одного поставщика может быть самым простым, но практически никогда не является наиболее экономичным и гибким вариантом.
Скорее всего, можно построить более экономичную инфраструктуру хранения, если выбрать из предложений нескольких поставщиков. Это также поможет защититься от рисков, например, от решения поставщика существенно поднять цены или прекратить выпуск продукта хранения, от которого вы зависите.
Наличие нескольких поставщиков позволяет легче перестроиться в случае непредвиденных изменений.
Использование решения для управления данными, не зависящего от технологии хранения, также дает возможность избежать привязки к поставщику, поскольку позволяет переносить данные с платформы на платформу без необходимости их предварительной «регидратации».
Ошибка 4. Слишком быстрые действия
Любая серьезная миграция или обновление ИТ-системы, в том числе и системы хранения данных, сопровождается ощущением срочности. Конечно, двигаться нужно как можно эффективнее, однако ошибочно двигаться слишком быстро, не успевая подготовиться к серьезным изменениям, связанным с обновлением системы хранения.
Поэтому уделите время сбору данных, необходимых для выявления наиболее болезненных точек в текущей стратегии хранения данных, и определите, какие изменения в решениях для хранения данных принесут наибольшую пользу бизнесу. Не забудьте также собрать метрики, необходимые для принятия обоснованных решений по улучшению возможностей управления данными.
Ошибка 5. Игнорирование будущих потребностей в хранении данных
Будущее предсказать невозможно, но к нему можно подготовиться, предвидя, какие новые требования могут возникнуть к решениям для хранения данных в будущем. В настоящее время такие тенденции, как ИИ, устойчивое развитие и растущее внедрение сервисов данных, означают, что потребности типичного предприятия в хранении данных, скорее всего, изменятся уже в ближайшее время.
Например, для обучения моделей ИИ может потребоваться СХД, способная передавать данные быстрее, чем традиционные решения. Аналогичным образом, внедрение сервисов данных для поддержки целей FinOps может означать поиск путей более эффективной консолидации и совместного использования решений для хранения данных в различных бизнес-подразделениях.
Заключение: важность обновления систем хранения данных
Поскольку организации переходят от управления, ориентированного на хранение данных, к управлению, ориентированному на данные, ИТ-специалистам и архитекторам систем хранения данных придется изменить подход к оценке и закупке новых технологий хранения.
Способность проанализировать данные для принятия взвешенных, а не универсальных решений по хранению данных поможет ИТ-организациям справиться со многими грядущими изменениями, будь то облако, периферия, ИИ или что-то еще, что еще только маячит на горизонте.