Мастерское управление данными
Владимир Михалев, старший инженер MDM/Data Quality Центра программных решений компании «Инфосистемы Джет»
Все чаще среди ИТ-специалистов и бизнес-пользователей информационных систем звучит аббревиатура MDM (Master Data Management). Как и всякий популярный термин, MDM перегружен, в разных контекстах ему приписывается различный смысл. В этой статье мы планируем снять часть возникающих в этой связи неоднозначностей и дать практическую интерпретацию соответствующих определений и понятий.
История вопроса
В условиях жесткой конкуренции компаниям приходится искать пути сокращения затрат, роста эффективности, повышения качества своих продуктов и услуг. Зачастую решение этих задач связано с применением информационных технологий. В итоге возникает уже знакомая картина — в компании эксплуатируется большое число разнородных программ и информационных систем (ИС). Управлять информацией, расположенной во множестве источников, — дело трудозатратное и дорогое.
Те компании, которые стремились к минимизации расходов и повышению доходов, приняли на вооружение системы электронного обмена данными. Эти решения позволяют экономить деньги за счет перенаправления информационных потоков, раньше требовавших создания огромного числа бумажных документов, факсов, взаимодействия большого числа людей, организации многочисленных встреч. В итоге сегодня формирование системы обмена данными между разными программами является одной из ключевых задач любого бизнеса.
На этом пути дополнительной проблемой становится потребность в управлении базовыми справочными данными, т.е. теми данными, которые существуют в компании во множестве копий, содержащих подчас не совпадающую и противоречивую информацию. При этом они должны быть одинаковыми. В разных учетных системах справочные данные вводятся, классифицируются и кодируются по-разному. Отметим, что наличие несинхронизированных копий одной и той же информации приводит к проблемам производственного и информационного взаимодействия.
Что такое MDM?
Перечисленные выше проблемы вызвали к жизни целый набор технологий, стандартов и продуктов, предназначенных для управления основными, или мастер-данными и объединенных под общим названием MDM. Часто мастер-данные называют нормативно-справочной информацией (НСИ) или эталонными данными. Типичные их примеры — справочники поставщиков, клиентов, классификаторы материалов, оборудования, общероссийские классификаторы (ОКСМ, ОКВЭД, ОКАТО и т.д.), то есть всё то, что не претерпевает существенных изменений в процессе повседневной деятельности компаний и является информацией нетранзакционного характера. Разные типы мастер-данных принято называть доменами, например, домен «клиенты», домен «продукты» и т.д.
Цели MDM заключаются в обеспечении процессов формирования мастер-данных (сбора данных из внешних источников, повышения их качества за счет очистки и обогащения, поиска и объединения дубликатов и т.д.), а также их дистрибуции для дальнейшего использования в других ИС.
В силу своих особенностей часто выделяют 2 предметные области, автоматизируемые с помощью
Предпосылки и модели использования
Как уже было сказано, одной из предпосылок для внедрения
Одна из часто возникающих задач, характерных для подобных компаний, — это формирование единого клиентского справочника (CDI). С помощью MDM можно создать хранилище, которое будет содержать полные, достоверные и непротиворечивые клиентские данные. Информация, поступающая из внешних учетных систем, в
Рис.1. Организация консолидированных данных
Второй тип задач, которые могут быть решены с помощью MDM, — это создание единой платформы для централизованного ведения нормативно-справочной информации. Соответствующая система управления НСИ призвана обслуживать всех участников внутренних бизнес-процессов компании, а иногда и целых отраслей, нуждающихся в выверенной и актуальной справочной информации. Одним из типичных примеров здесь является справочник материально-технических ресурсов (PMI). Такие
Рис.2. Организация централизованной схемы ведения справочной информации
Следующий вариант применения MDM частично схож с организацией консолидированных данных. Здесь также происходит создание данных во внешних учетных ИС, они также передаются в
Например, в организации есть несколько разнотипных ИС, предназначенных для учета движения товарно-материльных ценностей. В одной из таких систем в рабочий справочник вводится новая товарная номенклатура. На следующем шаге она передается в эталонный справочник товарных номенклатур, реализованный с помощью
Рис.3. Организация схемы синхронизации справочной информации
Выделяют еще один вид MDM — это реестр (Registry). При данном подходе в хранилище мастер-данных реальные данные не хранятся. Задачи MDM в таком случае — быстрое выявление схожих записей во многих системах и источниках и их связывание. Это дает возможность в реальном времени и в центральной точке получать данные из источников по перекрестным ссылкам.
Следует отметить, что внедрение
Кто они — производители MDM-решений?
На рынке
Рис.4. Позиции производителей PIM-решений
Компания IBM является одним из лидеров рынка
Рис.5 Позиции производителей
Компания Oracle является крупным игроком в области MDM, у вендора существует множество специализированных решений. Oracle Customer Data Hub (CDH) является первым приложением в семействе специализированных хранилищ основных данных, разрабатываемых компанией Oracle. Продукт подходит для управления реестрами клиентов, сотрудников, населения и пр. Отметим, что Oracle CDH постепенно замещается другим
Компания Informatica широко известна в области хранилищ и интеграции данных. В то время как многие поставщики предлагают разные решения для разных доменов, которые зачастую навязывают фиксированные модели данных, Informatica избрала мультидоменный подход. Все необходимые домены мастер-данных можно вести на одной платформе и в рамках одного решения вендора. При этом между различными доменами могут быть построены связи любой сложности. Настраиваемые в Informatica MDM домены свободны от фиксированных моделей данных. Формирование «золотой» записи основывается на уровне доверия к конкретным атрибутам записей из систем-источников. При этом также можно учитывать дату/время изменения записи и использовать любые дополнительные бизнес-правила для изменения уровня доверия к атрибутам. Решение MDM от Informatica использует ведущую технологию поиска и выявления потенциальных дублей — Informatica Identity Resolution (IIR). Технология позволяет осуществлять высокоскоростной и высокоточный поиск и выявление потенциальных дублей с использованием механизмов нечеткой логики даже при низком качестве данных.
Немецкая компания SAP — крупнейший производитель корпоративного ПО. В числе прочих продуктов и услуг она предлагает решение по управлению основными данными — SAP Netweaver MDM. Продукт нацелен на средние и крупные предприятия. Решение является одним из ключевых компонентов платформы SAP Netweaver, предназначенной для построения и интеграции корпоративных решений. Данная система реализует централизованную архитектуру хранения справочных данных о продукции, клиентах и пр. Отличительной особенностью SAP MDM является мультиязычность программного интерфейса и самих данных: существует возможность заводить данные для одной сущности на разных языках.
Отдельно стоит отметить, что до недавнего времени цена и трудоемкость внедрения систем управления базовыми данными были неоправданно высокими для малого и среднего бизнеса. Стоимость легко могла достигать 1 млн долларов — недосягаемая цифра для таких компаний. И вот появились хорошие новости. Последняя версия Microsoft SQL Server включает в качестве бесплатного приложения
В последнее время на рынок вышло множество новых разработчиков MDM, включая Teradata, Kalido, ObjectRiver Inc., Talend и др. Так, компания Talend предлагает решение Talend MDM Community Edition, которое призвано составить недорогую альтернативу другим
Перспективы
По мнению специалистов, мировой рынок программного обеспечения класса MDM рассматривается как один из наиболее растущих в ИТ-отрасли. Так, по прогнозам Forrester Research, рынок MDM в этом году составит 6,7 млрд долл. Gartner полагает, что мировой доход от продаж ПО класса MDM в 2012 году достигнет 1,9 млрд долл., что на 21% больше, чем в прошлом. При этом, полагают аналитики, решения MDM появятся в центре ИТ-архитектуры многих организаций. Конкретных цифр по российскому рынку нет, но о его внушительных объемах и росте свидетельствуют примеры успешных внедрений
Контактная информация
Наши сайты: www.jet.su, www.jetinfo.ru. Электронная почта: info@jet.su.
Другие статьи раздела «Data Management, или О том, как управлять с умом»