Корпорация Teradata, поставщик решений для аналитики больших данных, представила новые варианты развертывания системы многофункционального анализа данных Teradata Aster Analytics on Hadoop и Teradata Aster Analytics on Amazon Web Services (AWS). Для работы предыдущих версий Aster Analytics требовались выделенные системы, однако теперь компании могут использовать более гибкие возможности для ускоренного извлечения ценной аналитической информации из имеющихся данных, независимо от их источника, делая использование Hadoop еще более выгодным для себя.

Эти возможности подкрепляют стратегию Teradata по разработке архитектуры гибридного облака (Teradata Hybrid Cloud). Данная технология предлагает принципиально новый уровень скорости обработки, гибкости и интеграции различных систем, а также более открытый подход к получению углубленной аналитики. Наличие огромных массивов данных, генерируемых Интернетом вещей, включая данные датчиков и мобильных устройств, привело к появлению индивидуальных архитектурных подходов, включающих в себя облачные решения и Hadoop. Сегодня корпорация Teradata выводит индивидуальные подходы на качественно новый уровень.

«Многие компании ищут пути интеграции средств углубленного анализа данных в имеющуюся инфраструктуру с хорошо управляемой многопользовательской средой. Теперь это стало возможным благодаря выпущенным корпорацией Teradata версиям Aster Analytics on Hadoop и Aster Analytics on AWS, — сообщил Ник Руда (Nik Rouda), старший аналитик компании ESG Global, отвечающий за анализ больших данных, — Новые версии позволяют пользователям создавать аналитическую среду и запустить анализ данных, хранимых в озере данных или в облаке. Используя версию для AWS, пользователи могут отказаться от значительных капиталовложений и сэкономить затраты, экспериментируя с передовыми технологиями анализа данных. В любом случае, новые возможности позволяют компаниям ускорить окупаемость инвестиций и выполнять анализ данных на необходимом их пользователям уровне — причем на очень выгодных условиях».

Обычно программные комплексы с открытым исходным кодом для углубленного анализа данных разрабатываются без учета потребностей бизнес-аналитиков; для их использования, развертывания и сопровождения необходима специальная подготовка. Несмотря на то, что средства углубленного анализа были адаптированы для работы с Hadoop, они изначально не предназначались для непосредственного использования на данной платформе, в связи с чем для их работы, как правило, необходима выделенная платформа для извлечения данных. Подобные решения обладают ограниченными возможностями масштабирования по количеству пользователей, объемам данных и вариантам применения.

«Основное преимущество Apache Hadoop — это расширяемость и способность интеграции альтернативных подсистем анализа и обработки данных. Выход продукта Teradata Aster Analytics на рынок — это большой шаг вперед, представляющий клиентам еще один очень мощный вариант реализации требовательных к ресурсам аналитических приложений, — указал Майк Ольсон, главный директор по стратегическим вопросам и соучредитель компании Cloudera, Inc.

Teradata Aster Analytics содержит инструменты анализа текстовых, траекторных, графических и статистических данных, а также средства машинного обучения, объединенные в едином интерфейсе и использующие общий синтаксис. Новые функции предоставляют гибкие возможности и очевидные преимущества.

Aster Analytics on Hadoop позволяет расширить сферу применения и эффективность использования озера данных Hadoop. Aster Analytics открывает доступ к Hadoop для рядовых бизнес-аналитиков, имеющих навыки работы с SQL и R. Также продукт Aster позволяет расширить круг пользователей, выполняющих анализ данных.

Работает непосредственно на платформе Hadoop, вместо того чтобы выгружать данные из Hadoop на аналитический сервер. Пользователи могут повысить скорость процесса обработки, сократив при этом издержки, уменьшив простои, а также риски, связанные с обеспечением безопасного перемещения данных.

Пользователи могут запускать обработку данных в выделенной и рабочей среде на том же кластере Hadoop и для тех же данных. Кроме того, в Aster имеется центр приложений, призванный помочь аналитикам в создании веб-интерфейсов для корпоративных пользователей.

Компании могут быстро создать выделенную среду для анализа данных в облаке и воспользоваться встроенными в Aster средствами анализа на основе SQL, чтобы ускорить процесс разработки. Если модель оказывается эффективной, достаточно просто «запустить в производство» те же аналитические данные в облаке.

Расширенные возможности анализа данных дают аналитику мощный набор средств многофункционального анализа требуемого уровня для экспериментов и итерации больших объемов данных без ограничений по времени.

Компании могут экспериментировать со встроенными функциями углубленного анализа и соответствующими информационными активами без необходимости расходования средств на приобретение, настройку и внедрение нового оборудования.

«Возможность запуска Aster Analytics непосредственно на платформе Hadoop — настоящий прорыв для всей отрасли, позволяющий любой компании существенно увеличить окупаемость инвестиций в Hadoop, — говорит Крис Тугуд, вице-президент Teradata по маркетингу продуктов и услуг, — Aster всегда был ориентирован на предоставление аналитикам доступа к большим данным на требуемом уровне. Но теперь углубленный анализ данных с помощью Hadoop стал по-настоящему массовым, позволяя бизнес-аналитикам и специалистам по обработке данных получать доступ к данным и анализировать их с помощью траекторных и графических алгоритмов, а также алгоритмов машинного обучения. Новые варианты развертывания для Hadoop и AWS — это отлично отработанные средства быстрого анализа данных для более широкого круга пользователей, позволяющие сократить издержки и риски, а также способ получить результаты быстрее, чем раньше».

Выпуск Teradata Aster Analytics на Amazon Web Services состоится в середине сентября 2016 года. Общедоступная версия Teradata Aster Analytics on Hadoop 7.0 будет выпущена в октябре 2016 года.