Глобальные файловые системы (GFS) объединяют данные из разных мест в единое гибридное облако, используя объектное хранилище с доступом, удовлетворяющим традиционным потребностям приложений, таким как блокировка файлов. Портал ComputerWeekly рассказывает о существующих решениях.

Данные важны для предприятий любого размера, и идея хранить их где угодно и получать к ним доступ отовсюду чрезвычайно привлекательна.

Именно это обещают GFS, которые призваны разорвать связь между физическим хранилищем и приложением и пользователем, объединив локальные и облачные данные в гибридное облачное хранилище с файловым (а в некоторых случаях и блочным) доступом.

Используя GFS, приложение или пользователь воспринимает файлы так, как будто все они находятся в одном месте, даже если данные могут располагаться в нескольких физических местах.

Рассмотрим, как GFS это делают, и какие формы они могут принимать.

Файлы, файловые системы и пространства имен

Крупные организации обычно имеют несколько хранилищ данных и различные файловые системы.

Это приводит к разрозненности данных и затрудняет обмен информацией или ее перемещение между приложениями. Если добавить к этому облако, то работа с данными становится еще более сложной задачей. Но, перейдя на GFS, организации могут воспользоваться преимуществами облачных и гибридных систем хранения.

GFS обычно строятся на базе объектного хранилища, которое само использует глобальное пространство имен. Это позволяет хранить данные в нескольких местах, но приложению (использующему объектное хранилище) представлять их так, как будто они находятся в одном месте.

Потребление объектных хранилищ стимулируется облачными провайдерами-гиперскейлерами, поскольку они позволяют им работать в требуемом масштабе в нескольких центрах обработки данных.

GFS идут дальше, позволяя предприятиям распределять данные между локальными хранилищами и публичными облачными ресурсами.

Особенности глобальной файловой системы

GFS использует глобальное пространство имен для объединения хранилищ в разных физических местах. Для хранения объектов используется плоская структура, а не иерархические каталоги. Каждый объект имеет уникальный идентификатор, что позволяет системам масштабироваться до огромных объемов данных, не становясь при этом громоздкими.

Однако большинство приложений не могут получить прямой доступ к объектному хранилищу. GFS решает эту проблему, связывая свой файловый сервис — обычно в облаке — с локальным оборудованием или виртуализированным приложением в локальной сети пользователя.

Это оборудование или виртуальная машина (ВМ) действует как кэш и, что очень важно, обеспечивает совместимость приложений. При этом все данные остаются в едином пространстве имен, что позволяет хранить их на облачных ресурсах, в частных облаках и на локальных массивах в онпремисных дата-центрах.

GFS также обеспечивают блокировку файлов, что предотвращает одновременную запись в файлы несколькими пользователями и появление ошибок в данных. Объектные хранилища не имеют блокировки файлов. В файловых системах она есть, поэтому поставщики GFS добавляют ее, чтобы обеспечить доступ в соответствии с ожиданиями приложений.

Поставщики добавляют и другие функции в зависимости от своего позиционирования на рынке. К ним относятся услуги по миграции, которые помогут компаниям перенести данные с устаревших сетевых хранилищ (NAS) на GFS. Также предоставляется поддержка различных ОС и приложений, позволяющая клиентам получать доступ к хранилищам без рефакторинга приложений.

Сценарии использования глобальных файловых систем

Основные сценарии использования GFS связаны с необходимостью хранения больших и растущих объемов неструктурированных данных.

В этом плане GFS очень похожа на объектное хранение в целом. Однако GFS обеспечивает больший контроль над тем, где хранятся данные — с возможностью сохранения части данных онпремис, и совместимость с существующими ОС и приложениями.

GFS подходит тем организациям, которые хотят получить преимущества глобального пространства имен и масштаба облака, но не могут напрямую перейти на объектное хранение. Она также будет полезна для организаций, которые вложили значительные средства в локальные системы хранения и хотят продолжать их использовать.

Поставщики глобальных файловых систем и что они предлагают

Каждый поставщик GFS использует несколько иной подход и даже называет свои продукты иначе.

CTERA использует Edge — кэширующий файловый механизм; CTERA Drive — агент для конечных устройств, а VDI — для виртуальных рабочих пространств. Компания утверждает, что у нее нет ограничений по емкости, и предоставляет сервисы совместного доступа к файлам и доступ на уровне устройств из Windows, Mac, Linux, Android и iOS.

Hammerspace предлагает глобальную среду данных, которая объединяет облако, дата-центры и периферию в один набор данных. Она обеспечивает доступ, многоуровневое распределение данных, версионирование файлов, дедупликацию, моментальные снимки и антивирус. Hammerspace также предоставляет доступ к облачным хранилищам, дата-центрам и традиционным хранилищам DAS, SAN и NAS.

Nasuni позиционирует свою UniFS как строительный блок для своей File Data Platform. Онпремисные периферийные экземпляры обеспечивают локальный доступ к кэшу, управление файлами и оркестровку. Nasuni IQ добавляет аналитику производительности и API.

Panzura позиционирует себя как единую платформу для неструктурированных данных. Ее глобальная файловая система — CloudFS, которая, по словам компании, создает единый, оптимизированный набор данных для предприятий. Сервис также имеет прямую поддержку мобильных устройств, которые синхронизируются непосредственно с облаком. Panzura также предлагает облачное блочное хранилище.

Глобальный файловый сервис Peer Software предлагает поддержку гибридных и мультиоблачных систем. PeerGFS — это только ПО с активной синхронизацией, глобальным пространством имен с использованием Microsoft DFSN (Distributed File System Namespaces) и интеграцией с объектными хранилищами. Оно также поддерживает резервное копирование и репликацию в облаке.

Программно-определяемая файловая система Qumulo охватывает локальные и облачные хранилища и ориентирована на высокопроизводительные и ресурсоемкие приложения.