В мире больших данных тренд слияния реляционных и NoSQL-подходов проявился уже давно. Во многие дистрибутивы Hadoop помимо различных NoSQL-СУБД включены “прослойки” для SQL-запросов, а поставщики “тяжёлых” РСУБД расширяют их поддержкой, как минимум, слабо структурированных данных и JSON-документов.
Инновационная гибридная архитектура Flex Zone в рамках аналитической платформы Vertica представлена компанией HP. Она записывает бессхемные данные (всевозможные автоматически сгенерированные отчёты, логи и т. д.) в реляционные таблицы Vertica в классическом NoSQL-формате ключ—значение, откуда их можно извлекать либо SQL-запросами, либо непосредственно из BI-движков. Подобные подходы, в принципе, уже не раз успешно реализовывались, казалось бы, что тут можно придумать нового? Сильная сторона Flex Zone в том, что само “значение” может на лету интерпретироваться как набор реляционных столбцов (полей записи) — например, если данные в хранимой текстовой строке разделены выбранными символами (пробелы, точки с запятыми и др.). Таким образом, к подобной информации можно обращаться, применяя всю мощь SQL-запросов, а при необходимости обрабатывать её NoSQL-средствами как “сырые” сведения и легко транслировать в NoSQL-СУБД HBase или Cassandra.
Стремление обеспечить реляционный анализ слабо структурированных данных понятно: в обучение SQL инвестированы огромные ресурсы, а в мире NoSQL единых стандартов нет и пока не предвидится. На этом фоне появление Flex Zone смотрится символичным ещё и потому, что она позволяет выполнять и обратную трансформацию: превращать реляционные таблицы в ключи—значения и адаптировать базы РСУБД к системам NoSQL. Кроме того, версия Vertica 7 помимо Flex Zone включает немалый набор технологий, превращающих её в универсальный механизм работы с данными: оптимизация и распараллеливание запросов (как между узлами кластера, так и между ядрами процессора), корпоративные средства защиты Kerberos, а также коннектор к репозиторию Apache HCatalog, предоставляющему унифицированный доступ к движкам Pig и Hive и данным, хранящимся непосредственно в файловой системе HDFS.