Тема расширения круга пользователей инструментов BI за пределы узкой группы аналитиков обсуждается не один год. Даже появился термин “всеобъемлющая бизнес-аналитика”. Однако реализовать этот подход на практике оказывается далеко не просто. О том, как преодолеть основные “подводные камни” рассказывает Майкл Павленко, генеральный директор Sybase в России и СНГ.
PC Week: Что затрудняет массовое распространение BI?
Майкл Павленко: Самое главное препятствие — недоверие к данным и результатам. Помимо этого распространению BI мешают сложность использования инструментов BI и посредственная производительность систем, предназначенных для самостоятельной работы пользователей. Поэтому многие BI-проекты в России сводятся к созданию некоторого стандартного набора отчетов. Но это никак нельзя назвать операционной бизнес-аналитикой.
PC Week: Почему нет доверия к результатам?
М. П.: Причин несколько. Во-первых, результаты в новом инструментарии разнятся с результатами, которые пользователи получали в собственных наработках ранее. Во-вторых, отчет долго формируется, но пользователь не хочет ждать. Он не понимает, что реляционной БД требуется гораздо больше времени для подготовки данных к анализу, чем для обновления транзакции. Такая медлительность настораживает пользователя, и он не доверяет BI. Кроме этого, данные непонятны сотрудникам, так как не отражены в системе BI в привычном для них виде. Получается, что компания покупает дорогие BI-системы, ИТ-отдел их внедряет, а люди ими не пользуются. Это плохо сказывается на распространении технологии бизнес-аналитики внутри компании.
PC Week: Что делать в такой ситуации?
М. П.: Прежде всего, интерфейс должен быть не только интуитивным, но и простым в использовании: чем меньше кликов, тем лучше. Затем данные и связи между ними должны быть понятными. Если пользователь все понимает и ему легко работать, то ему нравится инструмент и он его будет применять.
Далее, необходимо обеспечить высокое быстродействие. Традиционные реляционные СУБД умеют быстро обрабатывать транзакции, но совершенно не приспособлены для обработки аналитических запросов. Для этого требуются специальные СУБД, которые выпускают некоторые компании. Так, Sybase еще в середине 1990-х разработала систему IQ, работающую с языком SQL, но внутри организованную совершенно не так, как реляционная СУБД.
PC Week: Получается, для BI предприятие не может использовать свою реляционную базу данных?
М. П.: Совершенно верно. Не понимая это, ИТ-отделы традиционно не рассматривали этот вопрос. Когда предприятие решает внедрить BI-систему, ИТ-шники исходят из того, что СУБД у них уже есть, а модель данных они сделают сами. Но из этого обычно ничего не получается, так как система работает медленно. Чтобы производительность была более или менее удовлетворительная, требуются огромные усилия. В результате тратятся огромные деньги на дополнительное оборудование, лицензии на софт и человеческие ресурсы, а рост производительности не превышает 5—10%. И только тогда, наконец, выясняется, что нужна специальная СУБД.
PC Week: Переход на специализированную СУБД устраняет проблемы?
М. П.: Кроме нее, еще нужна специализированная модель данных для создания хранилища, в котором должны храниться два типа данных: детальная информация, например все заказы для всех клиентов за десять лет, и агрегированные данные, необходимые для того, чтобы не пересчитывать основные показатели каждый раз заново. Процесс агрегации называется Extract, Transform and Load (ETL) и для него применяются специальные инструменты. С их помощью, например, можно агрегировать все заказы по клиентам или доход по продукту, т. е. подготовить все ключевые показатели эффективности. А когда потребуется отчет, достаточно просто распечатать эти показатели, построить график по клиенту или по продукту, а также провести более глубокий анализ, путем рассмотрения деталей, формирующих вышестоящие агрегаты (drill-down).
PC Week: Как ИТ-отдел узнает эти ключевые показатели?
М. П.: Для этого в проекте BI обязательно должны участвовать бизнес-пользователи. В России зачастую это не соблюдается, хотя бывают и исключения. Например, в одном из крупных частных российских банков главным руководителем проекта BI является первый заместитель финансового директора, все делается под запросы бизнес-пользователей и результат положительный.
Если же бизнес не участвует проекте, ИТ-шники делают хранилище так, как считают нужным, и получается система, которая не отвечает задачам пользователей. В результате с этой системой работают только ИТ.
PC Week: Что еще нужно учесть при построении BI-системы?
М. П.: Следует использовать готовые модели данных, которые сейчас предлагают несколько компаний. Например, Sybase предлагает Industry Warehouse Studio (IWF) — набор физических моделей данных для разных отраслей (банков, телекома, ритейла, страховых компаний и т. д.). Причем ядро у всех моделей одинаковое, потому что все применяют одни и те же атрибуты — заказы, поставки, клиенты, сотрудники, договора и т. д., а дальше идут надстройки, специфичные для каждой отрасли. Такую модель можно развернуть на любой СУБД, в том числе и на реляционной. Но на специализированной базе данных (например, Sybase IQ) все будет работать гораздо быстрее.
Поверх этой модели можно использовать любой BI-инструмент. Такой подход значительно упрощает и ускоряет построение BI, а также уменьшает общую стоимость владения, так как не нужно для каждого нового отчета строить отдельные витрины данных или OLAP-кубы. Детальный анализ (drill-down) легко доступен, потому что все связано между собой.
Таким образом, для внедрения BI нужна специализированная СУБД, над ней — модель данных, а поверх — BI-инструмент. В такой конструкции нет ничего лишнего, поэтому ее внедрение будет недорогим, а полученная в результате система будет быстро работать.
PC Week: Спасибо за беседу.