Компания CA (более известная в России под ее прежним названием Computer Associates) подписала соглашение с фирмой Exeros о дистрибуции ее инструментов профилирования Exeros X-Profiler в составе интегрированного комплекса CASE-средств для управления данными CA ERwin Data Modeling Suite. Как заявляют представители CA, включение в состав их CASE-пакета программных средств фирмы Exeros (под названием CA ERwin Data Profiler) позволит предложить рынку первое интегрированное решение, объединившее профилирование и моделирование данных. По словам вице-президента CA Сина Грэхема, оно поможет решать проблемы управления данными предприятиям среднего масштаба, для которых имеющиеся на рынке инструменты корпоративного уровня слишком сложны и дороги. В частности, такие предприятия смогут теперь самостоятельно развертывать системы управления мастер-данными (MDM).
Под профилированием понимают процесс предварительной проверки данных, находящихся в различных источниках, перед их совместным использованием в тех или иных приложениях, либо перед загрузкой в единое хранилище. При этом строятся метрики, описывающие качество исходных данных и их соответствие корпоративным стандартам. Осуществляется проверка метаданных: принадлежность данных определенному типу (алфавитный, цифровой) и отсутствие выхода их значений за пределы заранее заданных диапазонов, соответствие общепринятым шаблонам (почтовые индексы, телефонные номера), соблюдение формальных правил взаимозависимости (соответствие телефонного кода и страны в контактных данных). Обычно процесс профилирования осуществляется в три этапа: на первом проверяются отдельные поля таблиц БД, на втором выявляются взаимозависимости полей внутри одной таблицы и на третьем проверяется кросс-табличная связь данных и степень ее избыточности (эта информация в дальнейшем может использоваться в процессе моделирования для выбора первичных и внешних ключей).