Сегодня многие компании ищут пути для замены прежних систем хранения данных (СХД) на новые программно-определяемые решения (Software-Defined Storage, SDS). Главная причина этого процесса — желание избавиться от зависимости, связанной с использованием оборудования одного вендора, гибко наращивать (или сокращать) применяемые ресурсы, решать новые функциональные задачи, а в итоге добиться сокращения эксплуатационных затрат при росте эффективности использования вычислительных мощностей, опираясь на возможности корпоративного ЦОДа и публичного облака.
Как считает Джессика Лионс (Jessica Lyons), редактор издания SDxCentral, несмотря на ожидаемый рост рынка еще не сформировалось окончательное мнение, в каком виде будут существовать SDS-системы, какое оборудование из ныне используемого все-таки придется заменять в первую очередь. Вот как она обосновывает свою позицию.
Для SDS характерно то, что их программная часть отделена от аппаратной начинки. В IDC считают, что это приведет в итоге к формированию абсолютно автономного программного стека, который будет полностью отвечать за решение любых функциональных задач СХД на уже имеющемся оборудовании.
Попытку сформировать список функций, которыми должны обладать SDS-системы, недавно осуществила отраслевая некоммерческая ассоциация SNIA (Storage Networking Industry Association). По ее мнению, в нем должны быть отражены необходимые средства автоматизации, стандартные интерфейсы, предусмотрены средства для масштабирования и обеспечения прозрачности в отношении выполняемых операций. Последнее имеет особое значение для пользователей, потому что благодаря этим средствам они смогут осуществлять мониторинг и управление хранилищем, учитывая его аппаратные возможности и контролируя будущие затраты.
Вендоры SDS-решений, однако, видят происходящее в ином свете. Они выбирают между реализацией блочного, объектного и файлового доступа к данным, изучают возможность построения гиперконвергентных решений, обеспечивающих благодаря модульности гибкие возможности по выстраивании эффективных конфигураций оборудования, простоту и легкость его масштабирования.
Традиционные системы хранения
Среди традиционных корпоративных систем хранения данных наиболее распространены решения двух типов — сетевые устройства хранения (Network Attached Storage, NAS) и сети хранения данных (Storage Area Networks, SANs).
NAS выстраиваются из отдельных устройств, работающих с файлами. Передача данных осуществляется по локальной сети с использованием Ethernet.
SAN работает иначе. Это — связная сетевая инфраструктура, выстроенная из устройств хранения данных, которые работают как дисковые массивы и реализует метод блочного доступа к сохраняемым данным. Для передачи данных между такими устройствами часто применяется высокопроизводительный волоконно-оптический канал связи.
Выстраивание традиционных систем хранения всегда носило четко выраженный прикладной характер. Требовалось обеспечить определенный набор функций и производительность, других применений, кроме заложенных на этапе проектирования таких систем, не предусматривалось.
Это вполне устраивало заказчиков до тех пор, пока ни появились облачные вычисления и программно-определяемые решения. Вместе с ними пришли новые требования при работе с данными, с которыми прежние традиционные системы справлялись уже не так эффективно, как хотелось заказчикам.
В новых условиях важное влияние на развитие СХД стали оказывать два фактора: возможность наращивания объемов облачных вычислений и реализация объектной модели хранения данных. Это стало причиной для роста популярности SDS.
В качестве примера эффективной реализации нового подхода часто называют облачный сервис Amazon Web Services (AWS). Он представляет собой платформу, которая объединяет публичную систему облачных вычислений с объектным хранилищем данных Amazon Simple Storage Service (Amazon S3). компания предложила недорогое и сбалансированное решение, позволяющее извлекать преимущества из объектного принципа хранения, часто даже не осознавая, как работает эта технология.
Объектное хранение данных
В отличие от традиционных систем хранения, где сохраненная информация рассматривается в виде набора файлов или блоков данных, объектный подход предполагает управление данными как самостоятельными сущностями (объектами). Этот способ адресации применяется при работе с облаком.
Достоинство объектного подхода взаимодействия с данными состоит в том, что он не требует наличия заранее созданной и постоянно поддерживаемой в актуальном состоянии системы упорядоченной иерархии для работы данными. Нет необходимости выстраивать древоподобные информационные структуры, как при работе с файловыми хранилищами. Процесс извлечения данных становится более эффективным благодаря отсутствию предварительной работы со сложными по структуре системами каталогов.
Объектная система хранения рассматривается сегодня как идеальной вариант для работы с неструктурированной информацией (например, медиа-файлами или Web-контентом).
AWS — это не единственный крупный представитель объектной модели хранения информации. Собственные версии объектного хранения в публичном облаке предлагают сегодня, например, Microsoft Azure и Google.
Многие вендоры, известные своими продуктами традиционного типа, также добавили опции для построения объектных хранилищ.
Первый пример — это IBM, которая в 2015 г. приобрела стартап Cleversafe с его моделью объектного хранилища. В результате совсем скоро на рынке появилось решение IBM Cloud Object Storage, выстроенной на объектной технологии хранения данных.
Следующий вендор, пошедший по этому пути — Hitachi Data Systems. Свое присутствие компания застолбило выпуском серии продуктов на платформе Hitachi Content Platform.
Собственное объектное решение, допускающее масштабирование в облаке, недавно предложила и Dell EMC. Речь идет о платформе Elastic Cloud Storage (ECS), в которой недавно появилась опция создания гибридной модели хранения. Компания также объявила о работе над новым проектом Nautilus, который предусматривает создание SDS-хранилищ, поддерживающих развитый набор средств аналитики. Предполагается, что такое решение будет востребовано для работы с большими массивами потоковых данных, которые появятся в результате бурного внедрения Интернета вещей (IoT).
На рынке SDS-решений сейчас столкнулись представители разных групп. С одной стороны, это вендоры существующих традиционных решений (такие, как Dell EMC и IBM). С другой стороны, здесь активно работают компании, у которых раньше не было подобных решений (например, VMware и Red Hat). По оценкам IDC, в реальную тройку лидеров SDS-решений сейчас входят Dell EMC, IBM и VMware.
Аналитики также сыитают, на рынке SDS-решений будут развиваться все три направления типов хранения данных — файловый, объектный и блочный. Темпы их среднегодового роста на период с 2014 по 2019 гг. составят 10,5, 16,2 и 7,5% соответственно. Однако наиболее значительный рост ожидается в категории гиперконвергентных SDS-решений — 59,7%.
Гиперконвергентные SDS-решения
Решения на базе гиперконвергентной инфрастуктуры (Hyperconverged infrastructure, HCI) — это высокоинтегрированные системы, которые обладают полным комплексом ресурсов — вычислительных, сетевых и хранения данных. Они легко масштабируются в широком диапазоне характеристик. Их гибкость обеспечивается прежде всего за счет использования программной начинки.
HCI-продукты интересны потребителям прежде всего потому, считают в IDC, что они позволяют «повысить производительность за счет использования флэш-массивов, гибридной модели хранения, улучшенной интеграции их управления с системами оркестрации облачных платформ». Наибольшей популярностью на рынке сегодня пользуются HCI-решения от Nutanix, SimpliVity (недавно вошло в состав HРЕ), ScaleIO от компании Dell EMC.
Свое гиперконвергированное решение имеет VMware. Это — структурный блок vSAN, являющийся частью универсальной программной платформы для строительства ЦОДа. Она представлена тремя компонентами: vSphere для виртуализации серверов; vSAN для создания высокопроизводительной гиперконвергированной СХД для виртуальных машин на флэш-массивах и vCenter для управления средами vSphere.
NetApp и Cisco недавно выпустили собственное совместное решение для дата-центров. Это — система FlexPod, которая позволяет выстраивать гиперконвергентные СХД на оборудовании Cisco и флэш-массивах NetApp SolidFire.
Интерес заказчиков к HCI-решениям продиктован сегодня, по мнению Gartner, желанием сократить затраты на выстраивание СХД, добиваясь намеченной цели за счет использования уже установленного оборудования, снижения затрат на его обновление и техническое сопровождение.
Однако в таком подходе есть элемент риска. Он заключается в следующем. Приобретая традиционные СХД заказчик всегда получал оборудование, уже протестированное на совместимость с запускаемым ПО. В программно-определяемых системах программная и аппаратная части разделены. Поэтому появляется потребность в дополнительной проверке их на совместимость и более тщательном сопровождении.
Учитывая, что на рынке пока не так много компаний, которые обладают достаточным опытом и кадрами, чтобы проводить такие проверки, многим заказчикам потребуется привлекать специалистов со стороны. Это — вынужденные издержки, которые помогут избежать непредвиденных проблем, если они все-таки существуют.