Компания Hitachi Vantara представила Pentaho 8.3 — последнюю версию программной платформы для интеграции и анализа данных. В Pentaho 8.3 появился ряд функций, разработанных для поддержки DataOps — методологии совместного управления данными, которая позволяет компаниям полностью реализовать потенциал имеющихся цифровых активов. Платформа повышает гибкость работы с данными в любых средах, от периферийной до мультиоблачной инфраструктуры, и при этом обеспечивается высокий уровень контроля безопасности и качества данных.
«Методология DataOps нацелена на то, чтобы заказчики имели нужные данные в нужном месте в нужный момент. Именно этого и позволяют добиться новые функции Pentaho 8.3, — отметил Джон Маджи, вице-президент по маркетингу Hitachi Vantara. — Мы не только стремимся обеспечить максимально экономичное хранение данных на оптимальном уровне обслуживания, но и предоставить функции поиска, доступа и управления данными. За счет этого у заказчиков появляется возможность генерировать уникальные полезные знания и использовать весь экономический потенциал данных».
Pentaho 8.3 включает ряд усовершенствований, которые должны помочь организациям модернизировать практики управления данными, устраняя «барьер» между данными и их эффективным использованием. В число обновлений входят:
- удобный интерфейс для работы с потоками данных из труднодоступных источников.
- новый коннектор для SAP предоставляет простой и удобный интерфейс для комбинирования, обогащения и выгрузки данных из систем SAP ERP и Business Warehouse, при этом обеспечивается строгое соблюдение политик доступа к данным, настроенных внутри SAP-решений. Такие возможности дают более глубокое понимание специфики данных и повышают ценность аналитики, полученной на основе корпоративной информации;
- сервис Amazon Kinesis обеспечивает возможность работы с данными в реальном времени в среде AWS. Благодаря новым средствам интеграции платформа позволяет разработчикам AWS вместо написания кода принимать и обрабатывать потоковые данные в мощной визуальной среде, а также комбинировать их с другими данными, тем самым сокращая объем «ручных» операций;
- наглядность данных для повышения эффективности управления корпоративными данными.
- расширение интеграции с платформой Hitachi Content Platform (HCP), которое упрощает чтение, запись и обновление пользовательских метаданных HCP и позволяет легко выполнять запросы объектов с помощью системных метаданных. Благодаря этому пользователи могут использовать расширенные возможности поиска, а процесс получения аналитики становится более управляемым и удобным;
- интеграция с инструментом IBM Information Governance Catalog (IGC), которая сокращает объем «ручных» операций, необходимых для управления корпоративными данными. Распространяется ограниченно в виде бета-версии;
- упрощение отслеживания до источника данных, получаемых по таким популярным протоколам как AMQP, JMS, Kafka и MQTT;
- расширенная поддержка мультиоблачных инфраструктур.
- пакетная загрузка в AWS Redshift. Сегодня наиболее распространенным способом переноса данных из хранилищ S3 в Redshift является циклическое использование сценариев SQL для координирования пакетных загрузок. С помощью функционала пакетной загрузки в Redshift пользователи смогут значительно повысить продуктивность операций;
- новый коннектор для Snowflake. Snowflake становится одним из наиболее часто используемых хранилищ облачных данных. Однако для многих аналитических проектов необходимы данные и из других источников, в том числе из облачных сервисов. Pentaho 8.3 предусматривает возможность комбинирования, обогащения и анализа данных из хранилища Snowflake с данными из других источников, в том числе AWS и Google Cloud.