Стоимость владения облачной системой складывается из множества элементов. Одними из самых дорогостоящих по сей день остаются системы хранения данных (СХД), вдобавок финансовые аспекты сильно связаны со всей программно-аппаратной архитектурой СХД: на одном и том же оборудовании производительность различных облачных файловых систем может отличаться в разы. К сегодняшнему дню на рынке появляется зрелое СПО для облачных СХД, и поставщики проприетарных решений, от EMC до NetApp, уже ощущают их давление.
Два технически различных подхода к реализации облачной СХД демонстрируют системы Ceph от Inktank Storage и Gluster от Red Hat. Базовые версии этих продуктов распространяются свободно в исходных текстах, а плата взимается за обслуживание и наборы дополнительных возможностей. Ceph — это распределённое объектное хранилище и файловая система, отличающаяся высокой живучестью за счёт встроенных механизмов репликации и самоизлечивания. По своему прямому назначению и Gluster позиционируется как параллельная отказоустойчивая файловая система, также поддерживающая объектный формат. Отказ от централизованного хранения метаданных в обеих системах снимает большинство типовых проблем с производительностью. Однако на низком уровне их реализации сильно различаются, что необходимо учитывать при построении конкретной облачной СХД.
По умолчанию размер блока данных в Ceph равен 64 Кб, а в Gluster — 128 Кб, и менеджеры Red Hat ловко этим воспользовались: в серии тестов Gluster обогнал “конкурента” в два-три раза. Но настройки Ceph позволяют изменить размер блока даже до мегабайта, и в таком случае производительность скорее всего оказалась бы на уровне Gluster. Более важны другие характеристики: обе системы масштабируются почти линейно на петабайты в кластерах из тысяч узлов, и качественных различий здесь не выявлено. Сжатие данных работает примерно одинаково, а вот полезная возможность Ceph вести журналирование на флэш- и иных скоростных накопителях может в ряде ситуаций дать существенный выигрыш. Побеждает Ceph и по другим параметрам: она более живуча, так как использует крупные элементы кластера, которые быстро формируют репликационные копии в параллельном режиме. Развёртывание и управление коммерческой версией этой системы весьма удобно, потому что многие важные функции встроены в неё саму, а Gluster предоставляет их в формате дополнительных модулей. Но зато в плане потенциала и консультационных ресурсов Gluster, активно развиваемая крупной компанией, выглядит солиднее. Главное же, что обе эти системы смотрятся сегодня достойными и недорогими альтернативами многим проприетарным СХД для облачных систем.