Informatica еще совсем недавно справедливо считалась мировым лидером в довольно узкой области загрузки данных в информационные хранилища из разнородных источников с попутной их трансформацией и очисткой (ETL). Сегодня указанная ниша существенно расширилась и связано это с изменением роли данных: все чаще мы слышим о Data Driven бизнесе, в котором данные становятся либо дополнительным мощным драйвером, либо лежат в основе совершенно новых предприятий, возникающих, подобно пресловутому Uber, с нуля. Об этом на очередном форуме Informatica Day 2016 рассказал Павел Лихницкий, генеральный директор фирмы DIS Group, мастер-дистрибьютора компании Informatica.
Данные становятся активом, и их, как и любой другой актив, нужно рационально использовать с выгодой для предприятия. Сегодня они сосредоточены не только в самой компании, но и в массе внешних источников — у партнеров, заказчиков, в социальных сетях, у операторов телекоммуникационных и банковских услуг. В оргструктуре крупных заказчиков, в том числе и российских, появляются должности директора по данным (Chief Data Officer), а высшее руководство проявляет все больший интерес к такой дисциплине, как Data Governance.
Говоря о ней, управляющий директор DIS Group Александр Тарасов посетовал на отсутствие адекватного перевода этого термина на русский язык, поскольку буквальная калька «управление данными» может только вводить в заблуждение. Если management предполагает прямое управление и директивное принятие решений, то под governance скорее понимается методологическая организация процесса работы с данными и создание условий для эффективного функционирования системы без внешнего вмешательства. Все это важно в силу того, что данные превращаются в один из важнейших корпоративных активов, от их состояния, полноты, качества и актуальности во многом зависит успешность, а иногда и само существование бизнеса. По сути, понимаемое таким образом управление данными по своей важности становится на одну доску с управлением финансами, производством, логистикой и персоналом. Data Governance определяет корпоративные политики, стандарты, бизнес-процессы и регламенты, призванные обеспечить максимальную эффективность и полезность данных, накапливаемых и используемых предприятием.
В качестве технологического фундамента для всестороннего управления данными Informatica предлагает свою платформу Intelligent Data Platform, в составе которой наряду с традиционными инструментами ETL, контроля качества данных и ведения справочников мастер-данных, сегодня появились средства обеспечения безопасности и управления облачными и большими данными. Об основных новшествах последней десятой версии трех важнейших компонентов платформы, которые чаще всего применяются российскими компаниями, — PowerCenter, Data Quality и Data Integration Hub — рассказал главный эксперт по продуктам Informatica Фуад Бульбеллю. Он обратил внимание, в частности, на новые инструменты динамического мэппинга, усовершенствованные средства мониторинга использования ресурсов системы и более широкие возможности подключения к облачным источникам данных.
По словам директора Informatica по продажам в регионе EMEA Массимо Миаццетто, его компания, шесть продуктов которой находятся в лидирующих сегментах соответствующих гартнеровских квадрантов, очень уверенно чувствует себя на мировом рынке, доведя в прошлом году оборот до 1 млрд. долл. Informatica последовательно держит курс на партнерскую модель бизнеса, имея соглашения как с ведущими мировыми вендорами (глобальными партнерами), так и с сильными локальными игроками в тех или иных странах. Одним из таких партнеров является российская DIS Group, которая по утверждению Массимо Миаццетто обладает всеми необходимыми компетенциями и может нести в данном регионе полную ответственность за продукты вендора. Этим он по сути констатировал, что DIS Group фактически выполняет функции местного представительства Informatica. Будучи мастер-дистрибьютором, DIS Group имеет ряд локальных партнеров второго уровня, но при этом и сама ведет проекты у российских заказчиков.
Об одном из таких проектов — построении корпоративного хранилища данных — рассказал директор по проектам Ростелекома Александр Шовковый. С технологической точки зрения основными приоритетами указанного проекта были предсказуемость развития системы и ее гибкость, отказ от применения жестко связанных программно-аппаратных комплексов и максимальная опора на СПО. В качестве СУБД в хранилище используются EMC Greenplum для структурированных данных и Hortonworks для Big Data. За интеграцию и загрузку данных из разнородных источников отвечает ПО Informatica. Предполагается использование системы, в частности, для управления маркетинговыми кампаниями и скоринга. Для генерации отчетов и OLAP-анализа применяется ПО Oracle BI.
В проекте Московского кредитного банка, о котором сообщил начальник одного из его отделов Михаил Гричик, напротив широко используются как проприетарные решения, так и программно-аппаратные комплексы Oracle Exadata и Big Data Appliance. В числе применяемых СУБД — Oracle, IBM DB2 и Microsoft SQL Server, а аналитических движков — Essbase, Tableau и Microstrategy. Функции ETL, разумеется, берет на себя ПО Informatica PowerCenter. В планах банка на ближайшие годы — формирование расширенного профиля клиента (360 View), реализация прогнозной аналитики и встраивание в бизнес-процессы сложных аналитических процедур на основе качественных данных.