Говорить о точности и полноте данных уместно не только в научном контексте. Как показывает опыт, избыточная, неполная или ошибочная информация может стать причиной потерь — в том числе и финансовых — для тех, кто ею пользуется. Избыточность данных, к примеру, приводит к дополнительным затратам на хранение информации, неполнота может обернуться принятием неверных решений, ну а о последствиях использования ошибочных данных и говорить не стоит.
Источники некорректностей многочисленны и разнообразны: ими могут оказаться, в частности, неверные действия оператора при вводе информации (причем в общем случае нельзя ограничиваться лишь случайными ошибками, следует учесть и преднамеренные), неправильные алгоритмы ее обработки, ошибки при передаче данных между различными информационными системами и пр.
Именно поэтому обеспечение качества данных в сфере информационных систем давно стало актуальной задачей, а степень важности ее решения постоянно растет хотя бы потому, что увеличиваются объемы и сложность используемых данных.
В условиях кризиса естественным оказывается более пристальное внимание к разного рода аспектам повышения эффективности бизнеса, в том числе к снижению расходов на ИТ-инфраструктуру предприятия в самом широком смысле (в том числе с учетом затрат, связанных с обработкой информации). И конечно, в “турбулентной” среде существенно возрастает фактор доверия к используемым данным.
Описанная проблематика стала предметом состоявшейся в конце сентября в Москве конференции Informatica Day, в ходе которой представители компании Informatica и ее партнеров рассказали о проблемах, возникающих при интеграции данных; о технологиях, разработанных для решения соответствующих проблем; об опыте применения подобных технологий российскими предприятиями.
К числу достоинств предлагаемых компанией Informatica технологий относится поддержка всех популярных сегодня операционных систем, аппаратных платформ, средств управления базами данных, бизнес-аналитики и другого инфраструктурного ПО. Этот факт обеспечил решениям Informatica широкий круг пользователей среди ведущих мировых компаний, работающих в сферах финансовых услуг, страхования, здравоохранения, производства, розничной торговли, телекоммуникаций, транспорта, энергетики, коммунальных услуг, а также правительственных учреждений и общественных организаций.
В нашей стране Informatica прежде всего известна благодаря работам по созданию хранилищ данных: деятельность компании в этом направлении здесь началась в 2005 г., в течение которого было выполнено три первых проекта. (Часть слушателей сентябрьской конференции как раз уже имела опыт сотрудничества с компанией в области построения хранилищ данных.) Однако, как заметил директор Data Integration Software (регионального представительства Informatica в России) по работе с ключевыми заказчиками Сергей Черных, в последнее время в активе компании постоянно увеличивается доля проектов, не связанных напрямую с созданием хранилищ данных. Стартовый проект такого рода компания реализовала в 2007-м, а в нынешнем году к этой категории уже относятся более 30% выполняемых ею проектов.
Проекты по так называемой очистке данных (с целью их последующего использования) относятся к числу наиболее часто практикуемых. Инструментом для их реализации служит корпоративная платформа обеспечения качества данных — Informatica Data Quality, позволяющая в соответствии с настраиваемыми бизнес-правилами распознавать данные, выполнять различного рода проверки (в частности, по выявлению дублирования информации и взаимосвязи между данными), обеспечивать стандартизацию данных и т. п. Работы по обеспечению качества данных могут быть частью более крупных проектов, например, по построению хранилищ данных или внедрению ERP- либо CRM-систем.
Об опыте очистки клиентских данных рассказал участникам конференции директор департамента технологического развития Бинбанка Сергей Вихров. По его свидетельству, работы, продолжавшиеся четыре месяца, позволили в числе прочего повысить долю удовлетворяющих правилам банка записей о клиентах с 35 до 90% и устранить 13% дублирующих записей.
Программа конференции включала выступления, посвященные и другим типам проектов. В частности, практическим опытом применения продуктов Informatica при решении интеграционных задач поделился руководитель управления развития аналитических систем и внутрибанковского учета Промсвязьбанка Тимур Яковлев, а в презентации руководителя департамента архитектуры систем поддержки бизнеса “Вымпелкома” Максима Смирнова вопросы интеграции данных в процессах поддержки бизнеса излагались применительно к опыту оператора связи. Основой интеграции корпоративных данных в этих проектах служит платформа Informatica PowerCenter, позволяющая извлекать и объединять данные из различных систем и бизнес-приложений.
По словам Сергея Черных, важными для российских заказчиков являются проекты по миграции данных, необходимость в которой возникает, например, при переводе информационной системы на другую аппаратную или программную платформу или при переезде предприятия на новое место. На отечественном ИТ-рынке также постепенно появляется спрос на проекты, связанные с повышением эффективности работы предприятия со своими бизнес-партнерами. Инструментом для решения этой задачи может быть платформа Informatica B2B Data Exchange, обеспечивающая прозрачный обмен данными, в том числе и неструктурированными, как в пределах предприятия, так и с внешними бизнес-партнерами.
Вполне логично, что заказчиками решений Informatica в России являются преимущественно банковские учреждения. Как известно, с точки зрения использования информационных технологий эти структуры продвинулись гораздо дальше других. Кроме того, они оперируют большими объемами данных, а цена ошибочной информации может оказаться — в буквальном смысле — крайне высокой.
Участники конференции могли ознакомиться также с зарубежным опытом. Ведущий ИТ-архитектор крупной голландской телекоммуникационной компании KPN Томас Рейчел выступил с докладом об управлении клиентской информацией (на примере своей фирмы), а вице-президент по разработке корпоративных систем Bank of America Ричард Спинк рассказал о использовании в этом банке решения по преобразованию данных в стандартные форматы — Informatica B2B Data Transformation.