Бытует такое мнение: если приходится долго думать при ответе на вопрос о том, чем вам будет полезна та или иная новая технология, это означает, что она вам пока не особенно нужна. В подобном подходе есть рациональное зерно, но бывает так, что понятное на первый взгляд название технологии далеко не в полной мере соответствует ее реальному содержанию. Похожая ситуация сложилась вокруг набирающего в последнее время популярность направления real-time BI (бизнес-аналитика в реальном времени). Из-за устойчивой ассоциации понятия “реальное время” с управлением машинами, оборудованием и измерительными приборами, требующим мгновенного по человеческим меркам времени реакции (доли секунды), многие эксперты поспешили осудить термин real-time BI как сугубо маркетинговый и предложили пользоваться более обтекаемым right-time BI (бизнес-аналитика в нужном масштабе времени). Беда в том, что и второй термин нуждается в дополнительной расшифровке. А так ли уж велика смысловая разница между ними?
Ведь и в технических системах управления реального времени допустимая задержка между событием и реакцией на него, будучи мгновенной по человеческим понятиям, может существенно различаться для разных объектов. В одних случаях достаточно одной секунды, в других и миллисекунда — неприемлемо большой интервал. Иными словами, и там под реальным временем понимают вовсе не эмоциональную “мгновенную” реакцию, а вполне определенный (оптимальный для данного объекта) масштаб быстродействия системы. Принимая это во внимание, попробуем разобраться, что стоит за RT BI (как видите, и аббревиатуры у обоих вариантов терминов одинаковы).
Понятно, что RT BI противопоставляется прежде всего традиционной бизнес-аналитике, предполагающей периодическую пакетную загрузку данных в общее хранилище из множества транзакционных источников и последующий их анализ с помощью тех или иных BI-инструментов. Недостаток традиционного подхода в том, что он в большей мере обращен в прошлое и фактически не учитывает самую свежую информацию о состоянии бизнеса. Согласитесь, было бы трудно пользоваться автомобилем, если бы его спидометр показывал скорость с часовой задержкой, а сведения о запасах топлива в бензобаке соответствовали состоянию на вчерашний день. И хотя для многих процессов, таких как выпуск стандартной отчетности, вполне достаточно традиционных BI-инструментов, есть задачи, к примеру раннее обнаружение мошеннических действий, когда без оперативной бизнес-аналитики не обойтись.
Некоторые консалтинговые компании, чтобы помочь своим заказчикам принять обоснованное решение о необходимости внедрения системы RT BI, предлагают им ответить на десяток основных вопросов, и если большинство ответов будет указывать на полезность такой технологии, то решение должно быть положительным. К сожалению, нередко число положительных и отрицательных ответов примерно одинаково и бывает очень трудно оценить, компенсируются ли недостатки технологии ее достоинствами. Для разрешения подобной коллизии президент консалтинговой фирмы Bolder Technology Ричард Хэкаторн предложил довольно разумный подход, использующий в качестве мерила деньги.
Суть его легко понять, взглянув на приведенный рисунок, который описывает реакцию системы управления бизнесом (в том числе и BI-системы) на то или иное событие с точки зрения достигаемого финансового результата. Черная кривая показывает, как уменьшается получаемая предприятием выгода по мере торможения его реакции на событие. К примеру, если в ответ на вопрос потенциального клиента менеджер сразу же представит ему список имеющихся на складе изделий нужного профиля и их цены, то вероятность заключения сделки достаточно велика. Если же для подготовки подобного ответа потребуется два дня, клиент скорее всего успеет найти другого поставщика. Очевидно, что ускорение реакции не обходится даром и требует тех или иных затрат, причем с уменьшением времени задержки затраты растут (красная кривая). Там где две эти кривые пересекаются, находится точка окупаемости затрат. Иными словами, добиваться ускорения реакции имеет смысл лишь до тех пор пока ожидаемая выгода не перекрывается затратами на ее обеспечение.
В каких же случаях оперативная бизнес-аналитика может приносить реально ощутимую выгоду? К уже упомянутой борьбе с мошенничеством можно добавить задачи кредитного скоринга, планирования спроса, сохранения клиентской базы и т. д. Несомненно, без RT BI невозможно функционирование систем мониторинга бизнеса (Business Activity Monitoring, BAM), отображающих текущие показатели эффективности на виртуальных приборных панелях. По мере все более широкого развертывания сервисно-ориентированных архитектур (SOA) ведущие поставщики бизнес-приложений начинают включать BI-функции (вызываемые как сервис) в транзакционные бизнес-процессы (встраиваемая бизнес-аналитика), что заметно повышает требования к быстродействию контура BI. Да и распространение методов процессного управления ставит в повестку дня задачи оперативного мониторинга текущих бизнес-процессов.
Вопрос о том, в каких случаях необходимо то или иное быстродействие BI-системы, требует привлечения опытных консультантов и специалистов заказчика. Они должны будут не только оценить требуемое время реакции, но и детализировать его структуру. Дело в том, что в общем случае это время складывается из трех составляющих:
- времени извлечения данных из транзакционных источников, их трансформации, очистки и загрузки в хранилище;
- времени, затрачиваемого собственно на анализ и доставку нужных результатов конкретным пользователям;
- времени, необходимого для принятия менеджером управленческих решений или осуществления системой неких функций в автоматическом режиме.
В каждом отдельном случае требования к указанным трем составляющим могут быть совершенно разными. Иногда бывает важно обеспечить максимальную актуальность анализируемых данных, а требования к скорости выполнения аналитических процедур остаются теми же, что и для традиционных BI-систем. В других ситуациях вполне допустима работа с историческими данными, но на их анализ и инициализацию тех или иных реактивных бизнес-процессов отводится очень короткое время.
Совершенно очевидно, что для каждой из трех составляющих времени реакции нужны свои инструменты, причем далеко не все они относятся к категории BI. Существенную роль здесь играют также технологии middleware. Все они в совокупности и будут определять уровень затрат, необходимых для реализации того или иного варианта RT BI. Так, для повышения степени актуальности анализируемых данных предлагаются технологии инкрементной выгрузки небольших объемов данных (Micro ETL), осуществляемой либо периодически, либо в ответ на определенное событие. При этом конечно же возрастает нагрузка на транзакционную систему и возникают определенные проблемы с качеством данных, поскольку отдельные их элементы могут оказаться несогласованными с исторической информацией, уже загруженной в хранилище. В частности, для ускорения аналитических процедур в хранилище нередко помещают заранее вычисленные агрегированные значения. При каждой инкрементной загрузке соответствие между исходными данными и агрегатами может нарушаться.
Необходимо следить и за корректностью мастер-данных: для этого понадобятся инструменты EAI (Enterprise Application Integration). Если надо обеспечить полную синхронизацию данных между хранилищем и транзакционными источниками, инкрементную выгрузку придется производить в ответ на каждую зафиксированную транзакцию. Альтернативой являются технологии EII (Enterprise Information Integration), позволяющие формировать наборы данных для анализа, извлекая их из источников каждый раз, когда инициируется тот или иной запрос. Решение всех подобных задач потребует определенных финансовых затрат.
Что касается повышения скорости выполнения аналитической процедур, то она достигается такими известными методами, как параллельная обработка, применение высокопроизводительных OLAP-серверов, работа с материализованными представлениями и оперативными хранилищами данных (ODS, Operational Data Store), включающими только самые свежие выгрузки из транзакционных источников и не содержащими исторической информации. Время принятия решений следует сокращать посредством автоматически генерируемых предупреждающих сообщений, стандартных подсказок и рекомендаций, в том числе и по проведению дополнительных аналитических процедур. Для автоматизации реакции на те или иные события (в частности, на результаты анализа) применяются серверы бизнес-правил (BRE, Business Rules Engines) и средства комплексной обработки событий (CEP, Complex Event Processing). Оба эти инструмента бывают нужны и на первых этапах, когда выгрузка данных или аналитическая процедура должны запускаться по событию или по некоторой логически связанной комбинации событий.
Итак, не стоит надеяться на то, что систему RT BI удастся просто купить у какого-то замечательного вендора. Ее можно только построить, выполнив достаточно сложный проект, в котором должны быть оптимизированы как ожидаемые результаты, так и затраты. И та и другая задача требует участия весьма квалифицированных консультантов и применения адекватных программных средств. Заметим, что обе кривые из приведенного нами рисунка подвержены значительным изменениям: с одной стороны, быстрое развитие технологий способствует сдвигу кривой затрат влево, а с другой — выгоды от повышения быстродействия могут заметно увеличиться при переходе на какую-то совершенно новую бизнес-модель. Не исключено, что в силу тех или иных нормативных актов увеличение скорости реакции на определенные события придется обеспечивать в обязательном порядке, даже если это не сулит никакой финансовой выгоды. Поскольку проекты такого рода будут далеко не самыми дешевыми, приступать к ним следует только после тщательного экономического обоснования. Ряд экспертов предупреждает в этой связи об одной довольно неожиданной опасности. Если в большинстве проектов внедрения новой ИС типичной является проблема ее неприятия и даже своеобразного саботажа со стороны рядовых менеджеров, то в данном случае нередко соседние подразделения, увидев, что у их коллег реализуется система RT BI, начинают требовать развертывания такого же решения и у них. Причины тут могут быть самыми разными: от элементарной зависти до попыток оправдать собственные просчеты отсутствием передовых инструментов.
Как отмечалось выше, построение систем RT BI потребует применения широкого спектра программных средств, многие из которых выходят за рамки современных платформ BI. В этой связи определенное преимущество получают мегавендоры (IBM, Microsoft, Oracle, SAP), обладающие обширными портфелями связующего и интеграционного ПО и купившие в последние годы ведущих игроков рынка BI (Cognos, Hyperion, Business Objects). Следует ожидать от них новых покупок перспективных разработчиков системного ПО, закрывающего определенные бреши в их продуктовых линейках. Во время финансового кризиса, когда стоимость компаний значительно снизилась, сделать это будет проще.