Компания Hitachi Vantara представила Pentaho 8.3 — последнюю версию программной платформы для интеграции и анализа данных. В Pentaho 8.3 появился ряд функций, разработанных для поддержки DataOps — методологии совместного управления данными, которая позволяет компаниям полностью реализовать потенциал имеющихся цифровых активов. Платформа повышает гибкость работы с данными в любых средах, от периферийной до мультиоблачной инфраструктуры, и при этом обеспечивается высокий уровень контроля безопасности и качества данных.

«Методология DataOps нацелена на то, чтобы заказчики имели нужные данные в нужном месте в нужный момент. Именно этого и позволяют добиться новые функции Pentaho 8.3, — отметил Джон Маджи, вице-президент по маркетингу Hitachi Vantara. — Мы не только стремимся обеспечить максимально экономичное хранение данных на оптимальном уровне обслуживания, но и предоставить функции поиска, доступа и управления данными. За счет этого у заказчиков появляется возможность генерировать уникальные полезные знания и использовать весь экономический потенциал данных».

Pentaho 8.3 включает ряд усовершенствований, которые должны помочь организациям модернизировать практики управления данными, устраняя «барьер» между данными и их эффективным использованием. В число обновлений входят:

  1. удобный интерфейс для работы с потоками данных из труднодоступных источников.
    • новый коннектор для SAP предоставляет простой и удобный интерфейс для комбинирования, обогащения и выгрузки данных из систем SAP ERP и Business Warehouse, при этом обеспечивается строгое соблюдение политик доступа к данным, настроенных внутри SAP-решений. Такие возможности дают более глубокое понимание специфики данных и повышают ценность аналитики, полученной на основе корпоративной информации;
    • сервис Amazon Kinesis обеспечивает возможность работы с данными в реальном времени в среде AWS. Благодаря новым средствам интеграции платформа позволяет разработчикам AWS вместо написания кода принимать и обрабатывать потоковые данные в мощной визуальной среде, а также комбинировать их с другими данными, тем самым сокращая объем «ручных» операций;
  2. наглядность данных для повышения эффективности управления корпоративными данными.
    • расширение интеграции с платформой Hitachi Content Platform (HCP), которое упрощает чтение, запись и обновление пользовательских метаданных HCP и позволяет легко выполнять запросы объектов с помощью системных метаданных. Благодаря этому пользователи могут использовать расширенные возможности поиска, а процесс получения аналитики становится более управляемым и удобным;
    • интеграция с инструментом IBM Information Governance Catalog (IGC), которая сокращает объем «ручных» операций, необходимых для управления корпоративными данными. Распространяется ограниченно в виде бета-версии;
    • упрощение отслеживания до источника данных, получаемых по таким популярным протоколам как AMQP, JMS, Kafka и MQTT;
  3. расширенная поддержка мультиоблачных инфраструктур.
    • пакетная загрузка в AWS Redshift. Сегодня наиболее распространенным способом переноса данных из хранилищ S3 в Redshift является циклическое использование сценариев SQL для координирования пакетных загрузок. С помощью функционала пакетной загрузки в Redshift пользователи смогут значительно повысить продуктивность операций;
    • новый коннектор для Snowflake. Snowflake становится одним из наиболее часто используемых хранилищ облачных данных. Однако для многих аналитических проектов необходимы данные и из других источников, в том числе из облачных сервисов. Pentaho 8.3 предусматривает возможность комбинирования, обогащения и анализа данных из хранилища Snowflake с данными из других источников, в том числе AWS и Google Cloud.