Публичные службы облачного хранения данных могут принести пользу СМБ, дополнив имеющиеся локальные мощности хранения или вовсе их заменив. Портал ComputerWeekly делится советами по поводу того, как правильно хранить файлы, блоки данных и объекты.

Технологические потребности СМБ гораздо ниже, чем у крупных предприятий, однако есть одна технология, к которой и те, и другие предъявляют особые требования — это хранение данных. Еще несколько лет назад, когда облачные технологии только зарождались, СМБ отдавали предпочтение недорогим СХД, которые, тем не менее, неплохо справлялись со своими задачами. Однако сегодня облачные хранилища становятся все более жизнеспособной альтернативой, что особенно актуально для небольших фирм, которые не владеют серьезными ИТ-ресурсами.

Предприятия могут подобрать множество вариантов облачного хранения. Взяв их на вооружение, они увеличивают операционные затраты, но зато могут значительно снизить капитальные затраты на покупку и обслуживание оборудования для хранения. Вопрос состоит в том, как воспользоваться преимуществами облака. На современном витке технологий оно позволяет качественно хранить второстепенные данные, такие как резервные копии, служить файловым хранилищем для домашних каталогов, данных совместного использования. Следует иметь в виду, что защита второстепенных данных требует детальной проработки и планирования.

Что касается критически важных данных, используемых традиционными базовыми приложениями, например, СУБД и ERP, то их перемещение в облако сопряжено со сложностями. Упростить эту задачу поможет локальная гиперконвергентная инфраструктура (hyper-converged infrastructure, HCI), которая берет на себя функционал сети хранения данных (storage area network, SAN) и дополнительный объем работ, связанных с ее обслуживанием.

СМБ, которые хотят модернизировать свою инфраструктуру хранения, могут воспользоваться богатством предложений для облачного хранения, сочетая их с локальными СХД.

Первичное и вторичное хранение, структурированные и неструктурированные данные

Как правило, хранилища делятся на две основные категории. Первичное (основное) хранилище обустраивается для обслуживания производственных рабочих нагрузок, требующихся для реализации бизнес-процессов. Вторичное хранилище предназначено для обслуживания данных, которые не связаны с текущими бизнес-процессами.

Помимо степени значимости данные подразделяются на структурированные и неструктурированные. Структурированные данные описываются моделями БД и задействуются системами ERP, системами обработки транзакций или веб-сайтами. Чрезмерная чувствительность транзакционных систем ко времени отклика в сети становится причиной того, что обычно их развертывают на базе блочных СХД, таких как SAN.

Неструктурированные данные — любые форматы данных, которые выходят за рамки моделей БД. К ним можно отнести офисные документы, изображения, потоковое видео и т. п. Часто эти типы данных содержат заголовки (метаданные) — краткие характеристики для идентификации, поиска, оценки, управления данными, поэтому фактически их можно признать «полуструктурированными» данными.

Неструктурированные данные, будь то первичные или вторичные, часто хранятся в NAS с файловым доступом или в объектном хранилище. Разнообразие форматов данных, которыми оперирует СМБ, выдвигает определенные требования к блочным, файловым и объектным протоколам. Поставщики общедоступных облачных сред, соответственно, реагируют на эти запросы и предлагают нужные протоколы.

Блочное хранилище и облако

Блочное хранилище в публичном облаке обычно доступно только для локальных виртуальных вычислительных машин (инстансов), что объясняется двумя причинами. Во-первых, блочные хранилища требуются для загрузки инстансов в виртуальных средах внутри гипервизора с локальных дисков с данными. Во-вторых, они крайне чувствительны в плане производительности облачной сети, особенно это касается времени отклика отдельного ввода-вывода. В то же время онпремисное общее хранилище, такое, к примеру, как SAN, обеспечивает время отклика гибридных массивов на уровне 10 мс и меньше, системы хранения класса All-Flash реагируют менее чем за миллисекунду.

Но что делать, если предприятие СМБ хочет применять блочное хранилище с публичным облаком? Решением может использование шлюза хранения. Это аппаратные и программные аплаенсы, которые устанавливаются в локальном ЦОДе и позволяют подключаться к блочному хранилищу в публичном облаке по таким протоколам, как iSCSI. При передаче через них данные периодически архивируются (для обеспечения защиты), что упрощает пакетную передачу и масштабирование локального хранилища в облаке.

Гибридные облачные хранилища предлагают, например, Microsoft (StorSimple) и Amazon (Storage Gateway). Они автоматически распределяют данные по уровням согласно тепловой карте, которая отслеживает их текущее использование, время существования и связи с другими данными. Наиболее активные данные (используемые чаще всего) хранятся локально, а менее активные и неактивные данные («холодные») автоматически переносятся в облако.

В качестве альтернативного варианта СМБ может рассмотреть перенос приложений в публичное облако и там же применять блочное облачное хранилище, однако такая схема должна являться частью более широкой стратегии применения облачных служб.

Неструктурированные данные

Для управления неструктурированными данными можно выбрать два подхода. Первый — задействовать файловое хранилище, которое находится в публичном облаке, и второй — использовать объектное хранилище. И в том, и в другом случае используемые протоколы (NFS/SMB — для файлов, HTTP — для объекта) будут работать в глобальной сети, с поправкой на то, что скорость доступа к файлам будет зависеть от латентности сети. Файловое хранилище в облаке предлагает аналогичные локальным NAS-устройствам функциональные возможности, но обладает более широкими возможностями для управления инфраструктурой, что требуется при развертывании оборудования в ЦОДе.

Поставщики облачных услуг периодически добавляют новые файловые системы, которые могут динамически масштабироваться в зависимости от нужд клиента. Уровень зрелости облачных файловых сервисов за последний год заметно вырос. Ведущие поставщики начали предлагать продвинутые решения хранения в качестве нативных облачных сервисов. К примеру, NetApp FabricPool автоматически распределяет «холодные» данные из основного хранилища между AWS и Azure, а технология NetApp Active IQ оптимизирует операции, прогнозируя будущие потребности в производительности и идентифицируя незащищенные данные.

Облачные службы хранения файлов могут предложить в качестве преимущества экономию средств. Такие платформы, как Nasuni Primary, обеспечивают глобальный доступ к файлам из любых локаций, что упрощает процедуру аварийного восстановления без дорогостоящей репликации (механизм синхронизации содержимого нескольких копий объекта) на уровне массива (array-based replication) или создания резервных копий. Это также предотвращает дублирование данных при их одновременном переносе в несколько удаленных ЦОДов с целью повышения скорости доступа или расширения эксплуатационных возможностей. Кроме того, хранение данных в единичном экземпляре значительно снижает риск случайного использования неактуального контента.

Безопасность хранения файлов в облаке и защита данных

Применение облачного хранилища файлов порождает новые проблемы, наиболее очевидной из которых является безопасность. Несмотря на то, что данные передаются в облако через Интернет и они зашифрованы, это не гарантирует их абсолютную защиту. Именно поэтому СМБ инвестирует средства в локальную двухточечную VPN-связь с облачным провайдером, что ввиду специфики работы VPN-сети увеличивает расходы и усложняет передачу данных. Данные шифруются не только при передаче в публичное облако, но и в месте хранения, когда они находятся в состоянии покоя (at-rest encryption). Для шифрования блоков информации клиент генерирует специальные шифровальные ключи.

В настоящее время локальные файловые службы не обладают тем же уровнем оперативного управления, что и локальные системы — им часто недостает шифрования данных на лету и в состоянии покоя. Чтобы улучшить ситуацию, некоторые поставщики предлагают для управления учетными данными интеграцию с Microsoft Active Directory и протоколом облегченного доступа к каталогам (LDAP). Следует иметь в виду, что создание резервных копий данных в публичном облаке по умолчанию отключено. Поставщики облачных услуг обязуются выполнять условия договора в режиме uptime (измеряется с момента загрузки и до момента прекращения работы), что позволяет вернуть работоспособность службе из резервной копии без учета изменений в данных. Другими словами, провайдер не будет восстанавливать случайно или злонамеренно удаленные данные, поэтому чтобы вернуть систему в актуальное состояние следует воспользоваться технологией резервного копирования в другое облако (cloud-to-cloud backup).

Хранилище объектов

Хранилище объектов работает на базе неструктурированного протокола хранения и обеспечивает качественное сбережение больших объемов данных по выгодной цене. Объекты — это файлы, объем которых может варьироваться от нескольких килобайт до нескольких гигабайт. Они обычно хранятся в больших логических контейнерах — сегментах (в AWS). Доступ к хранилищу объектов осуществляется по протоколу HTTP, а запросы отправляются через REST API (дает доступ к объектам и структурам объектов как к ресурсам). В результате каждый запрос является фактически независимым, что исключает блокировку файлов хранилищем объектов. Ее отсутствие требуется для потокового доступа или крупномасштабной обработки большого количества файлов (к примеру, для аналитики). СМБ может обращаться к хранилищу объектов для запросов к контенту, который редко изменяется структурно — репозиториям документов, обучающим материалам в форме видео и аудио, то есть к таким объектам, которые целиком заменяются на новые.

Экономическая эффективность

С целью оптимизации размещения данных поставщики облачных услуг предлагают воспользоваться предварительно заданными политиками. К таковым можно отнести опцию перемещения мало затребованных данных в «холодное» хранилище, например AWS Glacier. Несмотря на то, что некоторые службы облачного хранения устанавливают ограничения на доступ к «холодным» данным, предприятия могут значительно сэкономить на их хранении в облаке. Такими данными для перемещения в хранилища объектов могут быть резервные копии и архивы. Многоуровневую процедуру переноса можно настроить при помощи соответствующих политик.

Применяя хранилища объектов, важно знать, что объем данных в них, скорее всего, со временем значительно увеличится. Во-первых, если необходимо хранить предыдущие версии файлов, цена за каждый объект будет взиматься как за целый объект (даже если выбран более дешевый тариф). Во-вторых, облачные хранилища не обладают такими полезными функциями хранения, как дедупликация данных, поэтому если у фирмы имеется две версии файла на 10 Гб, которые отличаются только одним байтом, оплата будет взиматься как за 20 Гб. Кроме платы за хранение, выгрузку и передачу данных существует штраф за удаление данных, хранившихся в Glacier менее трех месяцев. Размер штрафа в три раза превышает месячную стоимость хранения этих данных.

Защита данных

Защита данных — одно из основных преимуществ облачных служб хранения данных. Объектные хранилища провайдеров нацелены на долгосрочное хранение данных, объем которых практически ничем не ограничен, и стоимость такой услуги для небольших фирм не очень высокая. СМБ могут задействовать их для хранения резервных копий — протоколы передачи объектов хранилищ в облаке хорошо подходят для потоковой передачи данных для резервного копирования. Благодаря центральному расположению данных восстановление можно выполнять из нескольких офисов. В свою очередь облачные провайдеры предлагают возможность реплицировать данные между своими ЦОДами и географическими расположениями. Однако в случае применения объектного хранилища для резервного копирования заказчик не сможет воспользоваться преимуществами дедупликации данных. Для реализации этой функции требуется ПО для резервного копирования, иначе стоимость периодически создаваемых резервных копий может вырасти в астрономические суммы.

Рынок

Не стоит забывать, что многие поставщики СХД и сами предлагают облачные версии своих аппаратных и программных решений. Это значит, что СМБ могут значительно сэкономить на приобретении локального аппаратного оборудования, сменив операционную модель на облачную.