Basho объявила, что СУБД Riak TS, предназначенная для Интернета вещей (IoT), будет продвигаться как Open Source.
Компания разработала распределенную NoSQL-СУБД Riak несколько лет назад, а прошлой осенью выпустила ее специализированный вариант Riak TS, ориентированный на работу с данными временных рядов (time series, TS). Компания утверждает, что это единственная база данных NoSQL-типа корпоративного уровня, оптимизированная для IoT и данных временных рядов, которые поступают в хранилище через определенные интервалы времени и снабжаются временными метками.
Данные такого рода характерны для IoT-устройств, таких как интеллектуальные датчики, которые обычно производят данные в огромных объемах. Например, метеорологическая компания The Weather Company использует Riak TS для хранения данных, ежедневно полученных от датчиков атмосферного давления, температуры воздуха и влажности. Пользователями Riak TS также являются Uber и AT&T.
Basho надеется, что ставка на данные временных рядов позволит ей выделиться среди других поставщиков NoSQL СУБД, таких как MongoDB или DataStax. Дело в том, что когда такие данные поступают от датчиков в больших объемах, операции чтения-записи выполняются со значительными задержками, что снижает эффективность работы с распределенными данными. Большинство систем распределяют ключи базы данных равномерно по кластеру. Как правило это является целесообразным, но не в случае временных рядов, когда данные из одного и того же временного диапазона распределяются по большому числу узлов, и доступ к ним замедляется.
Глава Basho Адам Рей утверждает, что в Riak TS используется уникальная распределенная система, которая обеспечивает преимущество при работе с временными метками или другими непрерывными данными: «Мы оптимизировали размещение данных таким образом, что на определенные узлы поступают данные из определенного временного диапазона, что сокращает количество операций, необходимых для выборки из этого диапазона».
По оценке Basho, Riak TS работает с данными временных рядов на 50% быстрее конкурентов, таких как открытая NoSQL-СУБД Cassandra. Эта оценка не подтверждена независимым источником, но теперь, когда Riak TS стала открытой, пользователи смогут сами это проверить.
Узлы СУБД Riak TS могут распределяться как по физическим, так и по виртуальным машинам, а также по их экземплярам в облачных средах, включая Microsoft Azure или Amazon Web Services.
Передавая Riak TS сообществу Open Source, компания дополнила свою СУБД средствами мультикластерной репликации, а также поддержкой REST API-интерфейсов и SQL-команд. Предполагается, что возможность использовать SQL-операции придется по душе корпоративным заказчикам, которые привыкли к традиционным базам данных.
Что касается надежности, то каждый кластер Riak TS хранит три идентичные копии данных, а благодаря мультикластерной репликации количество копий можно увеличивать до бесконечности. Теоретически это должно обеспечить высокую работоспособность и низкую частоту отказов.
В Basho считают, что благодаря открытости Riak TS разработчики получили возможность строить любые приложения без каких-либо проприетарных ограничений. Компания обещает всячески поддерживать распределенное сообщество разработчиков, которые могут передавать свои проекты непосредственно в репозиторий Basho Labs в GitHub.