Глобальные файловые системы (GFS) объединяют данные из разных мест в единое гибридное облако, используя объектное хранилище с доступом, удовлетворяющим традиционным потребностям приложений, таким как блокировка файлов. Портал ComputerWeekly рассказывает о существующих решениях.
Данные важны для предприятий любого размера, и идея хранить их где угодно и получать к ним доступ отовсюду чрезвычайно привлекательна.
Именно это обещают GFS, которые призваны разорвать связь между физическим хранилищем и приложением и пользователем, объединив локальные и облачные данные в гибридное облачное хранилище с файловым (а в некоторых случаях и блочным) доступом.
Используя GFS, приложение или пользователь воспринимает файлы так, как будто все они находятся в одном месте, даже если данные могут располагаться в нескольких физических местах.
Рассмотрим, как GFS это делают, и какие формы они могут принимать.
Файлы, файловые системы и пространства имен
Крупные организации обычно имеют несколько хранилищ данных и различные файловые системы.
Это приводит к разрозненности данных и затрудняет обмен информацией или ее перемещение между приложениями. Если добавить к этому облако, то работа с данными становится еще более сложной задачей. Но, перейдя на GFS, организации могут воспользоваться преимуществами облачных и гибридных систем хранения.
GFS обычно строятся на базе объектного хранилища, которое само использует глобальное пространство имен. Это позволяет хранить данные в нескольких местах, но приложению (использующему объектное хранилище) представлять их так, как будто они находятся в одном месте.
Потребление объектных хранилищ стимулируется облачными провайдерами-гиперскейлерами, поскольку они позволяют им работать в требуемом масштабе в нескольких центрах обработки данных.
GFS идут дальше, позволяя предприятиям распределять данные между локальными хранилищами и публичными облачными ресурсами.
Особенности глобальной файловой системы
GFS использует глобальное пространство имен для объединения хранилищ в разных физических местах. Для хранения объектов используется плоская структура, а не иерархические каталоги. Каждый объект имеет уникальный идентификатор, что позволяет системам масштабироваться до огромных объемов данных, не становясь при этом громоздкими.
Однако большинство приложений не могут получить прямой доступ к объектному хранилищу. GFS решает эту проблему, связывая свой файловый сервис — обычно в облаке — с локальным оборудованием или виртуализированным приложением в локальной сети пользователя.
Это оборудование или виртуальная машина (ВМ) действует как кэш и, что очень важно, обеспечивает совместимость приложений. При этом все данные остаются в едином пространстве имен, что позволяет хранить их на облачных ресурсах, в частных облаках и на локальных массивах в онпремисных дата-центрах.
GFS также обеспечивают блокировку файлов, что предотвращает одновременную запись в файлы несколькими пользователями и появление ошибок в данных. Объектные хранилища не имеют блокировки файлов. В файловых системах она есть, поэтому поставщики GFS добавляют ее, чтобы обеспечить доступ в соответствии с ожиданиями приложений.
Поставщики добавляют и другие функции в зависимости от своего позиционирования на рынке. К ним относятся услуги по миграции, которые помогут компаниям перенести данные с устаревших сетевых хранилищ (NAS) на GFS. Также предоставляется поддержка различных ОС и приложений, позволяющая клиентам получать доступ к хранилищам без рефакторинга приложений.
Сценарии использования глобальных файловых систем
Основные сценарии использования GFS связаны с необходимостью хранения больших и растущих объемов неструктурированных данных.
В этом плане GFS очень похожа на объектное хранение в целом. Однако GFS обеспечивает больший контроль над тем, где хранятся данные — с возможностью сохранения части данных онпремис, и совместимость с существующими ОС и приложениями.
GFS подходит тем организациям, которые хотят получить преимущества глобального пространства имен и масштаба облака, но не могут напрямую перейти на объектное хранение. Она также будет полезна для организаций, которые вложили значительные средства в локальные системы хранения и хотят продолжать их использовать.
Поставщики глобальных файловых систем и что они предлагают
Каждый поставщик GFS использует несколько иной подход и даже называет свои продукты иначе.
CTERA использует Edge — кэширующий файловый механизм; CTERA Drive — агент для конечных устройств, а VDI — для виртуальных рабочих пространств. Компания утверждает, что у нее нет ограничений по емкости, и предоставляет сервисы совместного доступа к файлам и доступ на уровне устройств из Windows, Mac, Linux, Android и iOS.
Hammerspace предлагает глобальную среду данных, которая объединяет облако, дата-центры и периферию в один набор данных. Она обеспечивает доступ, многоуровневое распределение данных, версионирование файлов, дедупликацию, моментальные снимки и антивирус. Hammerspace также предоставляет доступ к облачным хранилищам, дата-центрам и традиционным хранилищам DAS, SAN и NAS.
Nasuni позиционирует свою UniFS как строительный блок для своей File Data Platform. Онпремисные периферийные экземпляры обеспечивают локальный доступ к кэшу, управление файлами и оркестровку. Nasuni IQ добавляет аналитику производительности и API.
Panzura позиционирует себя как единую платформу для неструктурированных данных. Ее глобальная файловая система — CloudFS, которая, по словам компании, создает единый, оптимизированный набор данных для предприятий. Сервис также имеет прямую поддержку мобильных устройств, которые синхронизируются непосредственно с облаком. Panzura также предлагает облачное блочное хранилище.
Глобальный файловый сервис Peer Software предлагает поддержку гибридных и мультиоблачных систем. PeerGFS — это только ПО с активной синхронизацией, глобальным пространством имен с использованием Microsoft DFSN (Distributed File System Namespaces) и интеграцией с объектными хранилищами. Оно также поддерживает резервное копирование и репликацию в облаке.
Программно-определяемая файловая система Qumulo охватывает локальные и облачные хранилища и ориентирована на высокопроизводительные и ресурсоемкие приложения.