Спустя полгода с момента создания проект Hadoop Open Data Platform (ODP), некогда курируемый компаниями Pivotal и Hortonworks, передается в управление некоммерческой организации Linux Foundation. Как пишет ZDNet, эта организация будет заведовать разработкой ядра и эталонных спецификаций. Cообщается также, что альянс ODP обновил список участников. Общее их количество изначально составляло 14, в марте увеличилось до 15, а теперь — до 25 компаний. Среди них: EMC, GE, Hortonworks, IBM, Infosys, Linaro, Pivotal, SAS, Splunk, Toshiba, Verizon, VMware.
Кроме того, ODP получил статус совместного проекта Linux Foundation (Collaborative Project). «Apache Hadoop требует открытой стандартизации и интеграции, которые смогут ускорить и упростить его применение среди огромного сообщества пользователей», — заявил по этому случаю Джим Землин, возглавляющий Linux Foundation. Разработчики Open Data Platform намерены продвигать и развивать Apache Hadoop и другие связанные с ним Open Source-инструменты для работы с большими данными, уменьшая фрагментацию и создание дублирующих решений на этом рынке, а также формируя ODP Core — «набор компонентов программного обеспечения, детализированной сертификации и набор Open Source-тестов, которые индустрия может использовать для построения Big Data-решений и приложений для работы с данными». На начальном этапе в фокусе внимания ODP Core оказались такие технологии, как HDFS, YARN, MapReduce и Apache Ambari.
Появилась также информация и о новом конкуренте технологии Hadoop. Согласно информации издания VentureBeat, компания Cloudera вскоре представит движок Kudu — альтернативное предложение для компаний, нуждающихся в эффективных технологиях администрирования Big Data. Неофициальные источники сообщают, что компания уже распространяет новую технологию среди своих клиентов и планирует вскоре выпустить её как ПО с открытым кодом по лицензии Apache. По мнению президента и главного аналитика Enderle Group Роба Эндерле, Kudu может стать следующим шагом в эволюции открытого ПО, которое обеспечит стандартные средства хранения поддержкой высокопроизводительных приложений — отчётов в реальном времени, циклической выборки потоковых данных (time series) и построения моделей.