Apache Software Foundation в рамках создания платформы открытых данных ODPi (Open Data Platform Initiative) опубликовал первую версию ODPi Runtime Specification (спецификации для среды исполнения ODPi) и программного пакета для тестирования. Их создание отвечает задачам формирования стандартной модели развертывания корпоративных приложений, ориентированных на обработку больших данных с помощью технологий Apache Hadoop. Такие спецификации должны помочь компаниями унифицировать работу с большими данными на базе множества различных дистрибутивов Hadoop и послужить основой для интеграции с другими ИТ-системами.
Некоммерческая структура ODPi была создана год назад под эгидой Apache с целью унификации технологий больших данных, представленные сейчас документы являются первым результатом проделанной с тех пор работы. Ключевой задачей было определение минимального состав ядра ПО (ODPi Core), необходимого для обработки больших данных с использованием средств Apache Hadoop, Apache Ambari и ряда других разработок Apache. Эта работа в последние полгода велась в сотрудничестве с Linux Foundation, с которым ODPi заключила партнерское соглашение в сентябре 2015 г. Как пояснил старший менеджер ODPi Джон Метрик, для успешного продвижения спецификаций и для продолжения работ по их развитию необходимо сформировать широкое отраслевое сообщество, которое включилось бы в этот процесс.
Представленные сейчас спецификации базируются на уже существующих сегодня технологиях Apache Hadoop 2.7 и Apache Bigtop, а также используют ряд компонентов HDFS, YARN и MapReduce. Для проверки соответствия спецификациям предлагается набор тестов ODPi Runtime-Compliance. После выпуска Runtime Specification организация OPDi сосредоточится на подготовке спецификаций ODPi Operations Specification, которые должны помочь компаниям-заказчикам повысить эффективность процессов инсталляции и управления средой Hadoop и реализованных на ее базе приложений. Джон Метрик сообщил, что первая версия этих спецификаций будет готова летом текущего года. Кроме того, уже сейчас члены ODPi обсуждают возможные планы будущих работ, возможно, дальнейшее развитие инициативы будет связано с проектами Spark, Kafka, HBase и Hive.