Компания MapR Technologies, поставщик аналитической платформы Apache Hadoop, расширила ее корпоративные функции, добавив к дистрибутиву M7 базу данных NoSQL, и создала более быструю аналитическую платформу для перемалывания больших данных.
Презентация решения состоялась в г. Нью-Йорке на конференции O'Reilly Strata Conference + Hadoop World 2012.
Самым большим преимуществом добавления NoSQL в систему пакетной офлайновой обработки данных Hadoop является то, что теперь в некоторых случаях ее можно использовать в режиме реального времени. Это значительно ускоряет аналитические проекты для корпоративных пользователей.
“Возможности Hadoop и NoSQL сведены воедино, это расширяет границы применения решения, — сказал Джон Шрёдер, исполнительный директор и сооснователь MapR. — Благодаря MapR M7 операции над большими данными осуществляются с присущей корпоративному уровню надежностью и безопасностью”.
Полная совместимость с базой данных Apache
Платформа MapR M7 на уровне двоичных кодов совместима с Apache HBase, распределенным масштабируемым хранилищем больших данных для Hadoop. Шрёдер отметил, что клиентам не придется рекомпилировать или изменять код, чтобы воспользоваться функциями корпоративного уровня. M7 также поддерживает Apache HBase в рамках одного кластера.
Автоматизация является одним из ключевых факторов. Новая платформа M7 выводит HBase на корпоративный уровень благодаря быстрому восстановлению после программных и аппаратных сбоев и аварий, а также полной защите данных с помощью мгновенных снимков и зеркалирования, пояснил Шрёдер. Даже после нескольких программных или аппаратных сбоев и ошибок, приложения продолжат работу без вмешательства администратора.
По мнению Шрёдера, M7 поднимает производительность HBase на новый уровень. Устраняя необходимость в сжатии баз данных, M7 обеспечивает равномерную и стабильную производительность. Кроме того, используются новые структуры данных для минимизации вставок и обновлений, количества повторных чтений и перезаписи блоков на диске. M7 также поддерживает поколоночную обработку в памяти, предоставляя дополнительные возможности повышения производительности базы данных.
Существует и другие версии MapR — бесплатная MapR M3 и коммерческая MapR M5, более продвинутая по сравнению с M3 и включающая поддержку высокой доступности, возможность создания снимков данных и зеркалирование наборов данных, а также круглосуточную техническую поддержку с годовой подпиской.
Дистрибутив MapR уже доступен для использования на Google Compute Engine, представленном 28 июня на конференции Google I/O в г. Сан-Франциско, и облачном сервисе Amazon. Около года назад MapR стал поддерживать операционные системы Windows и Mac OS.