Наше представление о способах хранения данных меняется. Начав с дисков, подключенных непосредственно к серверу (direct-attached storage, DAS), мы перешли затем к сетям хранения данных (storage area network, SAN) и далее к виртуализации хранения данных, которая позволяет забыть о том, где физически хранятся наши данные. Теперь у нас есть облако, в котором работают облачные системы хранения, и это приводит к очередному витку эволюции в способах хранения данных.
Хранение данных в облаке — это не альтернатива локальному хранению. На самом деле, сервисы хранения данных в облаке дополняют и расширяют системы хранения традиционного ЦОДа, не требуя инвестиций в новое оборудование.
Экономическая модель облака позволяет пересмотреть подходы к хранению данных, извлечь преимущества из масштабируемости и экономии на масштабе, которую могут обеспечить большие облачные ЦОДы. Если вам нужен еще один терабайт, или вам нужно 200 терабайт — как лучше поступить? Приобрести дополнительную стойку или расширить квоту хранения в облаке?
Новые варианты архитектуры систем хранения с использованием облака меняют наш подход к их проектированию, позволяют расширить имеющиеся у нас среды хранения данных за счет нового оборудования, за счет облачных платформ или новых опций, встроенных в программное обеспечение.
Включение облачного хранилища в качестве дополнительного уровня архитектуры виртуализации хранения данных открывает большие возможности. Облачные гиганты, такие как Microsoft, Google и Amazon обладают такими возможностями экономии на масштабе, какие и не снились даже самым крупным ИТ-департаментам; это позволило им сделать огромные инвестиции в системы хранения на базе традиционных (HDD) и твердотельных (SSD) дисков. Кроме того, они построили глобальные сети, позволяющие хранить копии данных на разных континентах, и обеспечили защиту данных, используемых приложениями и сервисами, работающими на их облачных платформах.
Платформа AWS (Amazon Web Services) предлагает широкий ряд вариантов хранения данных, которые могут стать расширениями работающих у вас решений. Система Glacier предназначена для долговременного резервного и архивного хранения данных, не требующих высоких скоростей доступа. Строго говоря — это не есть гибридная среда хранения, но она может выступать в качестве дополнительного облачного уровня хранения. Системы облачного резервирования типа Backblaze или Mozy предназначены для хранения данных отдельных ПК. Microsoft позволяет сохранять в Azure резервные копии серверов c Windows Server.
StorSimple и Azure
Загрузка данных в облако может быть медленной. В решении этой проблемы могут помочь гибридные системы хранения, такие как Microsoft StorSimple (программно-аппаратный комплекс, ПАК). Для ваших приложений эти системы выглядят как еще одно SAN-устройство; при этом они расширяют область хранения данных, дополняя ее ресурсами облака Azure. Такая система может рассматриваться как локальный кэш данных, содержащий наиболее свежие и часто используемые данные. Загруженные в StoreSimple данные постепенно окажутся в облачном хранилище Azure, и все последующие их изменения будут также отражены в облаке.
Вам не понадобится проводить расчеты для определения начального объема хранения в StorSimple — все контролируется средствами Azure Management Portal. Вы можете использовать их для конфигурирования ПАК, а также для управления мгновенными снимками (снэпшотами) хранилища, резервным копированием и восстановлением данных. ПАК StorSimple использует интерфейс iSCSI и работает не только с системами на базе Windows. Вы можете работать с Linux-системами, а также использовать StorSimple в качестве хоста для виртуальных дисков VMware. ПАК автоматически производит распределение данных по уровням хранения — твердотельным дискам (SSD), обычным дискам (HDD) и облачному хранилищу, которое дает вам дополнительные 500 Тб, а занимает в стойке оборудования совсем немного места. Если вам не хватает дискового пространства, эта опция будет для вас весьма полезной.
Контроллер доступа к облачному хранилищу — один из наиболее полезных компонентов StorSimple. Он отвечает за доступ ваших приложений к облачным данным и очень полезен в сценариях создания облачной схемы катастрофоустойчивого резервирования, а также для передачи ваших локальных данных в облачные приложения. Если у вас несколько ЦОДов, вы можете использовать StorSimple как транзитное звено в схеме перемещения данных между ЦОДами и бизнес-подразделениями. Это не самая дешевая, зато самая гибкая из возможных схем.
Другие гибридные облачные решения
Покупка гигантом в области систем хранения EMC компании TwinStrata позволила расширить линейку продуктов EMC механизмом гибридного облачного хранения CloudArray, реализованным в виде физического ПАК или виртуальной среды. Локальный кэш обеспечивает быстрый доступ к данным, хранящимся в облаке, а инструменты создания снэпшотов позаботятся о резервных копиях. Как и описанный выше StorSimple, решение EMC поддерживает механизмы обеспечения катастрофоустойчивости, а в дополнение к этому — шифрование данных. В отличие от большинства сервисов облачного хранения, поддерживающих только файловый доступ, CloudArray работает также на блочном уровне.
Решение Filer от компании Nasuni — еще один механизм расширения вашей СХД в облако. Вы можете гибко управлять размером кэша, чтобы в полной мере соответствовать потребностям бизнеса. Оборудование предоставляется в аренду и обновляется по мере роста ваших запросов. Простейший вариант — виртуальная машина под Hyper-V или VMware, которая может работать как в AWS или Azure, так и в вашей локальной сети. Единая мастер-копия ваших данных хранится в облаке и может быть доступна через инсталляции Filers в разных офисах. Оборудование Filer поставляется в нескольких конфигурациях, рассчитанных на количество пользователей от 30 до 500 и содержащих по вашему выбору HDD- и SSD-диски. Вы покупаете все как единый сервис, поэтому вам не нужно как-то отделять систему Nasuni от вашего облачного хранилища; платите вы ежемесячно за потребляемый объем хранилища.
Сходным образом решение Global File System от компании Panzura создает копию ваших локальных файлов в облаке, что особенно эффективно при построении инфраструктуры VDI (Virtual Desktop Infrastructure). Имея контроллер в каждом офисе, вы можете строить бизнес-процессы, затрагивающие данные из разных локальных хранилищ — каждый контроллер дает одно и то же представление файловой системы, содержащей как локальные, так и облачные файлы. Если вам требуется добавить еще один локальный узел к вашей сети, вы подключаете еще один контроллер — и всё, можно работать. Одним из ключевых элементов решения от Panzura является глобальная схема блокировки файлов, работающая с облаком как с NAS-хранилищем. Возможность записи в файл дается в каждый момент времени только одному пользователю, это предотвращает потери и искажения данных при записи.
Возможность построить гибридное облако вам могут предоставить также средства управления частными облаками. Например, vCloud от VMware содержит инструменты для построения гибридных решений на основе Cloud Foundry и OpenStack. Хотя изначально этот механизм предназначен для организации частных облаков, в нем есть опция работы с сервисами OpenStack, размещенными в облаке. Построение гибридного облака собственными силами, скорее всего, будет более сложной задачей, чем покупка готового решения, но такой путь обеспечит вам большую гибкость.
Приложения и облачное хранилище
Более интересные варианты можно получить, совмещая облачные схемы хранения с приложениями. Следующая версия Microsoft SQL Server будет иметь опцию поддержки хранения данных в Azure, реализуя то, что Microsoft называет «эластичной БД». Умело оперируя различными уровнями хранения, SQL Server 2016 может отправить «холодную» часть данных из локальной таблицы в Azure, при этом логически эти данные останутся частью локальной БД. Таким образом, вы получаете быстрый доступ к свежим и востребованным данным, а устаревшие данные (которые раньше пришлось бы перенести в архив), останутся доступными теоретически всегда. Поддержка шифрования означает, что облачные данные сможет прочесть только тот локальный экземпляр SQL Server, у которого есть доступ к ключам шифрования.
Конечные пользователи уже давно научились применять гибридные схемы при помощи средств синхронизации с облаком. Стоит им сохранить файл в локальной папке Dropbox, Box или OneDrive, как в облаке создается его копия. Новые API, предоставляемые в Office 365, позволяют офисным приложениям работать с несколькими облачными провайдерами и размещать файлы там, где это удобнее всего дня бизнеса или индивидуального пользователя.
Вы также можете сконструировать ваше собственное гибридное хранилище. API, предоставляемые облачными платформами, можно обернуть тем или иным способом и тем самым обеспечить доступ к облаку практически из любого приложения. За счет такой обертки вы можете, например, спрятать вызовы RESTful API облачного хранилища внутрь драйвера, который для приложения ничем не будет отличаться от привычного драйвера локальной файловой системы. Следует только помнить, что гибридные схемы хранения, если сравнить их с локальными, привносят, подчас, существенные задержки в процессы чтения и записи данных.
Выводы
Можно с полным основанием считать, что облачные схемы хранения — это не замена локальному хранению, а способ расширения имеющихся систем, причем без необходимости закупки дорогого оборудования. Вложения в системы хранения в такой гибридной схеме складываются из капитальных (CAPEX) и операционных (OPEX) затрат, и это позволяет организациям более тщательно контролировать структуру затрат и выставлять счета на основании детальной информации о потребляемых ресурсах. Виртуализация хранения существенно облегчает подключение к облаку, поскольку облако выглядит как еще один узел в сети хранения данных.
Полный перенос данных в облако в принципе возможен, но для этого вам понадобится вложиться в высокоскоростной канал подключения к облачному ЦОДу, например в ExpressRoute для подключения к Azure. Более практичным сценарием видится использование гибридного облачного хранилища как дополнительного уровня в архитектуре хранения, либо как механизма передачи данных от локальных приложений к облачным приложениям, или как решение по обеспечению катастрофоустойчивости. Кроме того, хранение данных в облаке обеспечивает доступ к ним из любого офиса и, без преувеличения, из любой точки земного шара.