Компания Teradata, входящая в состав корпорации NCR, выпустила очередную версию продукта Teradata Warehouse Miner 5.0, автоматизирующего процесс подготовки данных для их последующего интеллектуального анализа. Он может применяться как с ее собственными инструментами Data Mining, так и с аналогичными средствами партнеров Teradata — фирм SAS, SPSS, Fair Isaac и KXEN.
За функции профилирования данных в Warehouse Miner отвечает модуль Teradata Profiler, помогающий повышать качество исходной информации путем распознавания повторяющихся записей и выявления утерянных данных, оценки их точности, определения формата данных и обнаружения внутренних противоречий, способных исказить результаты анализа. Указанный модуль в полной мере использует возможности параллельной обработки в СУБД Teradata и позволяет анализировать данные непосредственно в БД, не перемещая их из одного хранилища в другое.
По словам разработчиков, генератор аналитических наборов данных Teradata Analytic Data Set позволяет вдвое сократить время их аналитической обработки за счет ускорения предварительной подготовки исходной информации. Расширена поддержка языка PMML (Predictive Model Markup Language), существенно облегчающего использование одних и тех же моделей в различных приложениях. Управление моделями возложено на модуль Model Management. В дополнение к таким стандартным функциям, как мониторинг, описание и оценка моделей, Model Management содержит инструменты, автоматизирующие и процесс их внедрения.