Главным анонсом состоявшегося в мае форума EMC в Лас-Вегасе (США) стала презентация ПО VIPR, который корпорация по аналогии с программно-определяемыми сетями (software defined network, SDN) рекламирует как решение для внедрения программно-определяемого хранения данных (software defined storage, SDS) на основе объединения в виртуальный пул ресурсов разных дисковых массивов. Как это часто бывает, пресс-релиз EMC, посвященный ее новому продукту, всячески расхваливал его достоинства, но содержал крайне мало технических подробностей, так что весьма трудно было понять, какие новые технологии предлагает EMC.
Шанс подробнее познакомиться с VIPR представился на осеннем московском EMC Forum, где с презентацией этого нового решения выступил Дэйн Турбит, отвечающий в отделении Advanced Software корпорации EMC за продажи в регионе EMEA.
EMC VIPR — это программное обеспечение, которое устанавливается на виртуализированном с помощью технологий VMware многоузловом кластере серверов vApp. Оно состоит из трех основных компонентов — коннекторов хранения (storage connectors), глобальных сервисов управления и доступа к данным (Global Data Services) и самого контроллера VIPR.
Основная идея VIPR — это абстрагирование физических систем хранения с помощью виртуализации, что существенно упрощает управление всем жизненным циклом хранения данных в гетерогенной инфраструктуре СХД и разработку новых серверных приложений, обращающихся к этим данным. Системные администраторы с помощью коннекторов VIPR могут объединять разные дисковые массивы в многоуровненые виртуальные пулы ресурсов хранения, а разработчики приложений — выбирать тот пул, который оптимален для обслуживания их ПО, без учета специфики конкретного дискового массива или фирменных технологий его производителя. Сейчас коннекторы хранения выпущены для большинства дисковых массивов самой EMC (VMAX, VNX, VPLEX и Isilon), а также для унифицированных систем хранения FAS компании NetApp. В будущем EMC собирается разработать коннекторы и для систем хранения других вендоров, а также для стандартных дисковых систем начального уровня. Кроме того, благодаря использованию VIPR API-интерфейсов RESTful другие производители СХД могут самостоятельно написать коннекторы хранения VIPR для своих продуктов.
Для интеграции с системами управления виртуализированной серверной инфраструктурой и соответствующими API-интерфейсам для VIPR доступны коннекторы VMware vCenter Operations Manager, VMware vCloud Automation Center, VMware vCenter Orchestrator, OpenStack и ServiceMesh. С помощью таких коннекторов администраторы серверов могут по модели самообслуживания выделять ресурсы хранения, не вдаваясь в аппаратные особенности того или иного дискового массива.
VIPR Data Services представляют собой комбинацию разных типов данных (файлов, блоков и объектов), протоколов доступа к данным (iSCSI, NFS, REST) и таких функций хранения данных, как доступность, послеаварийное восстановление и безопасность. Эти сервисы должны максимально упростить доступ к данным при разных сценариях их использования. Например, для аналитических приложений, обрабатывающих большие объемы данных, требуется копирование файлов в ходе процедуры ETL (extraction, transfer, load — извлечение, передача, загрузка). Благодаря сервисам данных VIPR аналитическое приложение может обращаться напрямую к данным без ETL с помощью распределенной файловой системы Hadoop Distributed File System (HDFS). Другой сценарий задействования служб данных — обслуживание приложений, использующих API-интерфейсы REST, например Amazon S3 или OpenStack Switch, для извлечения объектов, хранящихся на массиве с файловым доступом, и манипуляций с ними. При этом другие приложения могут обращаться к тем же данным как к файлам без какой-либо их конвертации .
Контроллер VIPR с API-интерфейсами RESTful для доступа к ресурсам хранения позволяет разработчикам написать свое приложение только один раз и затем размещать его в различных облачных и виртуальных инфраструктурах без переписывания кода под разные интерфейсы систем хранения. Он располагается вне канала передачи данных (data path) и реализует расширенные функции генерации отчетов об использовании ресурсов и производительности, а также обеспечивает автоматизацию большинства процедур управления хранением.
Сама идея абстрагирования ресурсов разных дисковых массивов в единый виртуальный пул не нова — еще в первой половине прошлого десятилетия она была реализована в нескольких решениях для виртуализации ресурсов сетей хранения SAN, из которых наиболее известны система хранения TagmaStore компании Hitachi Data Systems (предшественница сегодняшней HDS Virtual Storage System) и виртуализатор хранения SVC корпорации IBM, впоследствии ставший основой дисковых систем IBM StoreWize V7000. Кроме того, сама EMC в 2005 г. попыталась вывести на рынок собственное решение для виртуализации SAN под названием Invista, однако этот проект потерпел полную неудачу. Чем же отличается VIPR от других платформ виртуализации хранения, появившихся около десяти лет назад?
Как пояснил нам Дэйн Турбит, уникальная особенность VIPR — это разделение канала передачи данных и канала передачи команд (control path). Благодаря такому разделению контроллер VIPR работает на виртуальном уровне и позволяет разбить пул хранения на несколько виртуальных массивов (подобно виртуальным машинам физического сервера), у каждого из которых может быть своя собственная политика управления, поэтому VIPR может централизованно выполнять все операции предоставления данных и управления ими, а приложения по-прежнему могут использовать те же сервисы доступа к блокам и файлам, которые до этого обеспечивались отдельными дисковыми массивами, теперь объединенными в общий пул. Кроме того, архитектура VIPR может быть расширена на массивы других производителей, и в ней используются открытые API-интерфейсы. Если вспомнить Invista, то разработанное в этом проекте ПО должно было функционировать на коммутаторах SAN, чтобы перенаправлять идущие по сети хранения пакеты с данными на нужную систему хранения. Таким образом, Invista располагалась в канале передачи и не могла виртуализировать СХД других производителей. Кроме того, в отличие от известных виртуализирующих приставок это легко масштабируемое решение за счет применения облачных технологий.
Первые поставки VIPR были выполнены в сентябре, так что пока рано говорить о том, насколько обещания EMC подтверждены практикой. Как отмечают в своих комментариях некоторые аналитики, в случае успеха VIPR может стать конкурентом не только для виртуализирующих приставок, но и для собственных массивов EMC VMAX и VNX, поскольку это ПО позволяет реализовать основную функциональность этих дорогих СХД (например, мгновенные снимки и динамическое выделение емкости приложениям) с помощью гораздо более дешевых дисковых систем стандартной архитектуры (так называемых commodity storage).