Хранилища данных
Не прошло и двух месяцев с момента, когда NCR объявила о начале действия в России программы построения хранилищ данных Right Start (см. PC Week/ RE, №19/97, с. 13), а корпорация уже успела провести в Москве семинар по этой теме. Рональд Свифт, вице-президент NCR по расширяемым хранилищам данных, в июне прочел российским партнерам и клиентам корпорации многочасовую лекцию о современном состоянии этой технологии, влиянии, которое новые способы обработки информации оказывают на развитие бизнеса, и достижениях NCR в этой области.
Первая группа разработчиков хранилищ данных появилась в NCR более двенадцати лет назад, однако широкой известностью технология пользуется только четыре года, поэтому ее с полным основанием можно назвать новой. Как все новое, хранилища данных окружены мифами: считается, что это безумно сложно, долго, дорого и пригодно только для крупных корпораций, тонущих в колоссальных потоках информации. Однако далеко не все эти мифы соответствуют действительности. Сегодня на счету NCR свыше 550 установок, один из клиентов корпорации - финская фирма, занимающаяся розничной торговлей и насчитывающая менее 90 сотрудников, включая грузчиков и водителей. По словам г-на Свифта, для создания работоспособного хранилища данных достаточно начальных капиталовложений в пределах $400 000, а программа Right Start предусматривает возведение первой очереди хранилища за три месяца. Однако молва права в том, что построить оптимальную инфраструктуру обработки информации на основе корректных моделей данных и алгоритмов их фильтрации и анализа невозможно без соответствующего опыта.
NCR определяет хранилище данных как технику сбора и управления данными из различных источников, позволяющую отвечать на вопросы и принимать решения, к которым нельзя было прийти раньше. Создаваемая информационная инфраструктура принесет пользу лишь в том случае, если она будет способна обеспечить корреляцию разнородных данных и преобразование их в информацию, т. е. обеспечить не только количественный отсев дублирующихся и малозначимых данных, но и их качественную трансформацию.
С точки зрения NCR, хранилище данных представляет собой не “коробочный” продукт, а динамичную структуру, развивающуюся вместе с бизнесом предприятия. Корпорация предлагает следующий путь превращения данных в информацию.
Данные, поступающие из разнородных источников (поставщики, склады, транспортные средства, точки розничной торговли, филиалы, партнеры и т. п.), фильтруются на основе единых согласованных правил. Затем данные, теперь уже соответствующие единой математической модели, поступают в БД хранилища. Отсюда они извлекаются инструментами анализа (data mining), ориентированными на конкретные предметные области, и преобразуются в раздельные киоски данных (data-mart). Именно с киосками данных работают подразделения предприятия, выполняющие специфические бизнес-функции.
В этом подходе объединены две достаточно популярные модели построения хранилищ данных. Согласно одной из них входные данные поступают на несколько фильтров и сразу преобразуются в киоски данных. При этом данные неизбежно многократно дублируются, но, что еще хуже, различия в механизмах фильтрации приводят к появлению нескольких версий истины. Реализуя вторую модель, подразделения берут данные непосредственно из центральной БД, однако в таком случае к данным не применяются инструменты анализа и не происходит преобразования данных в информацию.
Наиболее важные этапы при возведении хранилища данных по методике NCR - выработка правил фильтрации, организация центральной БД и создание первого киоска данных. Специалисты NCR работают здесь в тесном контакте с сотрудниками предприятия, знающими свои предметные области. Следующие киоски строятся на основе правил, полученных на предыдущем этапе, так что постепенно инженеры ИТ предприятия все меньше обращаются за помощью к консультантам из NCR. По словам г-на Свифта, в среднем хранилище начинает приносить прибыль через полгода, окупается через год, а максимальная эффективность достигается через два года.
Г-н Свифт уверен в перспективности этой технологии на российском рынке, несмотря на то что многие компании у нас не располагают историческими данными о своем бизнесе, необходимыми для функционирования хранилища данных. “Хранилище надо начинать строить сейчас, - говорит он, - а через два года, когда оно заработает во всю мощь, те данные, что были заложены на начальном этапе, уже станут историческими”.
Партнеры корпорации также не сомневаются в нужности хранилищ данных. По их мнению, первыми заказчиками станут правительственные структуры и нефтегазовые компании. Вилли Довидат, директор представительства NCR в России, убежден в том, что первый такой проект будет реализован у нас уже осенью.
Телефон московского представительства корпорации NCR: (095) 961-3030, адрес в Web: http://www.ncr.com.
Рафаэль Шамиев