АНАЛИЗ ДАННЫХ
С середины 90-х годов прошлого века на Западе стремительно растет интерес компаний к программным продуктам, которые позволяют аналитикам работать с большими объемами данных, накопленными в ERP- и CRM-системах и хранилищах данных, и извлекать из них полезную информацию. Информационная составляющая всегда играла важнейшую роль в эффективном управлении бизнесом, поэтому способность предприятий обеспечивать своих сотрудников всем необходимым для принятия взвешенных решений имеет огромное значение. Средства генерации регламентированной отчетности лишь отчасти решают эту проблему, удовлетворяя потребности весьма ограниченной группы работников. Следствием такой ситуации стало рождение целого сегмента рынка программного обеспечения - Business Intelligence (BI).
Однако сегодня пользователю нужно нечто большее, чем просто графики и таблицы. Необходимы инструменты, обеспечивающие безопасный доступ к источникам корпоративных данных и обладающие развитыми возможностями консолидации, анализа, представления данных и дистрибуции готовых аналитических документов как внутри организации, так и за ее пределами. Тенденция последних лет - интеграция программных решений и переход от специализированных аналитических решений к многоцелевым BI-платформам.
В состав BI-платформ входят средства для построения хранилищ и витрин данных, обработки произвольных запросов (Ad-hoc query) и выпуска отчетов (Reporting), инструменты OLAP, Data Mining (интеллектуального анализа данных) и KDD (Knowledge Discovery in Databases - поиска знаний в БД) и т. д.
На этом рынке представлены крупные зарубежные поставщики: BusinessObjects (www.businessobjects.com), Cognos (www.cognos.com), MicroStrategy (www.microstrategy.com), Oracle (www.oracle.com), SAS (www.sas.com), Microsoft (www.microsoft.com), Hyperion (www.hyperion.com), а также российские разработчики - фирмы BaseGroup Labs (www.basegroup.ru) с пакетом Deductor и Intersoft Lab (www.iso.ru) с платформой хранилищ данных и аналитической платформой “Контур”. В развитии BI-платформ сегодня наблюдаются следующие тенденции:
- встраивание BI-компонентов в СУБД;
- интеграция с Интернетом;
- поставка готовых аналитических приложений и средств быстрой разработки аналитических прикладных систем;
- расширение функциональности платформ за счет применения методов Data Mining и других современных технологий.
Тенденция 1. Встраивание аналитических компонентов в СУБД
Традиционно на продукты класса BI поставщики назначали высокие цены, доступные только для крупных компаний. Тем не менее спрос в данном сегменте постоянно увеличивался, в том числе и среди относительно небольших фирм. Именно поэтому внимание на него обратили лидирующие поставщики СУБД - Microsoft и Oracle, которые встроили BI-платформы в свои флагманские продукты, сделав их фактически массовыми.
Компания Microsoft пришла на рынок BI, выпустив SQL Server 7.0. Одним из новшеств этой версии стал интегрированный в СУБД компонент OLAP Services. В СУБД SQL Server 2000 он был трансформирован в Analysis Services. Стандартные BI-функции за счет полной интеграции Analysis Services с СУБД дополнялись средствами обеспечения безопасности, распределения анализируемых данных между различными серверами, управления предприятием на основе результатов анализа и т. д. А поскольку компонент Analysis Services был фактически бесплатной и неотделимой частью основного продукта, компания быстро вывела свое BI-решение на массовый рынок.
Несколько по-иному поступила корпорация Oracle. Она также вслед за Microsoft встроила свою BI-платформу Oracle OLAP Services в СУБД, однако поставляет ее только по требованию заказчика. По функциональным возможностям OLAP Services сравнима с многомерной СУБД Oracle Express, и ее появление, по существу, знаменует завершившуюся интеграцию технологии Oracle Express c реляционным сервером Oracle Database. Этот компонент в полном объеме поддерживает основной язык сервера Express, а для эксплуатируемых БД Express компания предусмотрела возможность их переноса в СУБД Oracle.
Такой подход отражает желание крупных поставщиков привязать пользователей своих СУБД к своим же BI-платформам. У него есть и положительные, и отрицательные стороны. Потребителю удобно, когда BI-платформа, предлагаемая поставщиком СУБД, органично в нее интегрирована. Недостаток же состоит в том, что BI-средства отдельно от СУБД неприменимы. Это особенно важно для тех компаний, которые по тем или иным причинам не желают развертывать СУБД на своем предприятии либо уже используют решения от другого поставщика.
Тенденция 2. Интеграция с Интернетом
Эта тенденция затронула практически всех поставщиков BI-платформ. Интеграцию с Интернетом в том или ином виде стараются поддерживать все производители, так как BI-платформа, лишенная средств работы в Web, априори воспринимается пользователем как неполноценная. Однако реализуется она различными производителями по-разному, и возможности работы через Интернет у них существенно отличаются друг от друга. Это может быть:
- размещение данных и публикация аналитических отчетов в Интернете;
- связывание кубов и анализ данных через Интернет;
- обмен информацией в виде кубов, готовых для анализа, и автоматическая их генерация.
Первый подход реализовала фирма MicroStrategy, использующая Сеть для публикации аналитических отчетов и витрин данных. Она имеет целую линейку решений, предназначенных для распространения информации о бизнесе: Web Analyst - для доступа к данным через Интернет, Web Reporter - для создания интерактивных экранных отчетов и анализа данных на их основе, Web Viewer - для просмотра статических отчетов. Решения компании, базирующиеся на Интернет-протоколах, позволяют работать с отчетами в стандартном Web-браузере под управлением любой операционной системы. Подобное решение отвечает требованиям многих пользователей, однако не раскрывает всех возможностей глобальной сети, оставляя производителю большой простор для улучшения продукта.
Второй подход нашел применение в продуктах Microsoft, которая объявила интеграцию с Web своим приоритетом и неотъемлемой частью платформы .Net. Службы анализа данных сервера SQL Server 2000 используют две новые технологии, поддерживающие выполнение анализа через Web. Во-первых, это возможность связывать по протоколу HTTP расположенные на различных серверах кубы данных для повышения эффективности анализа. Конечные пользователи видят связанные кубы и манипулируют ими так же, как и обычными: поставщики данных могут создавать, хранить и обслуживать какой-либо куб данных на одном сервере, одновременно открывая его для доступа как связанный куб для множества других серверов. Во-вторых, возможность организовать доступ к данным по протоколу HTTP и работу с ними в многопользовательском режиме. Поскольку важную информацию можно хранить в виде связанных кубов на защищенных компьютерах, доступных для других серверов, здесь нетрудно обеспечить безопасность исходных данных при обращении к ним через Интернет.
Совершенно по-иному реализована поддержка Интернет-технологий у российского поставщика BI-платформы “Контур” фирмы Intersoft Lab. Ею была разработана оригинальная технология микрокубов, специально оптимизированных для передачи по Интернет-протоколам. В отличие от решения Microsoft, позволяющего анализировать распределенные между различными серверами данные, микрокуб представляет собой мобильный контейнер OLAP-отчетов, в котором хранятся как сами данные, так и метаданные, определяющие внутреннюю структуру микрокуба, состав и способы отображения информации в пользовательских интерфейсах, таблицах и графиках. При помещении в микрокубы данные сжимаются в десятки раз. Благодаря такой компактности они прекрасно подходят для передачи больших объемов информации по Интернет-протоколам и пересылки по e-mail. При помощи специального многооконного Web-браузера “Контур OLAPBrowser” пользователь может открывать микрокубы прямо с удаленного сервера по HTTP. Программа “Контур дизайнер кубов” позволяет проектировать шаблоны и сценарии генерации микрокубов на основе данных из самых разных источников (хранилищ данных, OLTP-систем и др.). С помощью модуля “Контур генератор кубов” выполняется массовая генерация микрокубов по готовым сценариям. Такие кубы всегда отражают актуальную информацию, могут быть персонифицированы и включают в себя только данные, необходимые конкретному получателю. Эта технология особенно полезна для публикации прайс-листов на информационных сайтах, рассылки финансовой или бухгалтерской отчетности, каталогов товаров, отчетов о продажах, данных о клиентах и т. д.
Тенденция 3. Поставка готовых
Тенденция 3. Поставка готовых аналитических приложений и средств быстрой разработки аналитических прикладных систем
Современные BI-платформы поставляются как инструмент для создания корпоративных аналитических систем. Впоследствии компании сами настраивают его с учетом специфики своей организации. Тем не менее многие решаемые с помощью BI-платформ задачи можно обобщить и построить типовые шаблоны, например, для анализа клиентской базы. Кроме того, появляется все больше продуктов, позволяющих быстро разработать специализированные готовые приложения.
Компания Hyperion Solutions предлагает к своему продукту Hyperion Essbase более 300 подобных приложений, как собственной разработки, так и созданных ее партнерами и предназначенных для различных предметных областей. Специализированные модули для торговли, обеспечивающие анализ поставщиков, покупателей, продуктов и операций, есть у фирмы Business Objects. Отраслевые решения позволяют быстрее настраивать шаблоны и за счет этого снижать расходы на внедрение системы. По мнению аналитиков из международной организации TDWI (The Data Warehousing Institute), к 2004 г. появится огромное количество программных средств для вертикальных рынков и для решения узкоспециализированных задач.
Компания Cognos перешла к концепции пакетных аналитических приложений на базе продукта Cognos Business Intelligence Series 7, выпустив программы для анализа продаж, счетов контрагентов, главной книги, платежей контрагентов, закупок и складских запасов. Однако подобная универсализация задач без учета отраслевой принадлежности не всегда оправданна.
Готовые аналитические приложения, базирующиеся на собственной платформе хранилищ данных, поставляет и компания Intersoft Lab. Они созданы с учетом специфики российских коммерческих банков и предназначены для управления филиалами, финансового планирования и бюджетирования, финансового управления в кредитных организациях. В состав аналитической платформы “Контур” включен инструмент “Контур стандарт”, позволяющий быстро разрабатывать OLAP-приложения для прямого (Direct BI) оперативного анализа корпоративных данных. Таким образом, в этих продуктах реализованы обе тенденции: поставляются как готовые отраслевые решения, так и инструменты для построения специализированных приложений.
Тенденция 4. Расширение функциональности платформ за счет применения методов Data Mining
Технология Data Mining представляет собой один из элементов более общего подхода под названием Knowledge Discovery in Databases - поиск знаний, выраженных посредством взаимосвязей и взаимозависимостей, скрытых в “сырых” данных. Инструменты Data Mining позволяют делать прогнозы, проводить классификацию и кластеризацию данных и т. д. Интеграция этих средств с аналитической платформой может серьезно повысить ее возможности.
Типичный представитель производителей, поставляющих средства Data Mining в виде дополнений к основному продукту, - компания Microsoft. Модуль Microsoft Decision Trees, являющийся компонентом SQL Server 2000, основан на алгоритме построения деревьев решений и очень удобен для классификации объектов по определенным признакам, а Microsoft Clustering - для группировки записей в кластеры по методу ближайшего соседа.
Еще один российский поставщик BI-платформы, компания BaseGroup Labs, представляет на рынке аналитический пакет Deductor, инструментарий которого главным образом составляют программы, основанные на технологии Data Mining. В состав Deductor включены приложения, реализующие практически весь спектр алгоритмов: нейронные сети (классификация, прогнозирование), деревья решений (классификация), самоорганизующиеся карты (кластеризация), очистка данных и OLAP. Все они интегрированы с единым аналитическим ядром и не распространяются отдельно от него.
В линейку BI-продуктов компании Cognos входят два приложения, использующие технологию Data Mining: Scenario - для решения задач классификации, построения деревьев решений, поиска ассоциаций и исключений и 4Thought - для создания нейросетевых моделей с целью прогнозирования, классификации и т. д. Указанные приложения распространяются по отдельности, чем, по-видимому, Cognos пытается примирить две тенденции: с одной стороны, в пакете интегрировано несколько методик, с другой - они могут пополнять BI-платформу по мере необходимости.
Заключение
В борьбе за потребителя поставщики аналитических продуктов стремятся объединить в своих платформах самые передовые технологии. Благодаря подобной консолидации возможностей аналитические решения выходят на качественно новый уровень в таких важных для заказчиков областях, как бюджетирование, планирование, прогнозирование и т. д.
Рынок BI-платформ уверенно растет и развивается, несмотря на общий спад в ИТ-индустрии. По данным OLAPReport (www.olapreport.com), в 2003 г. он превысит 4,5 млрд. долл. Со своей стороны, TDWI прогнозирует, что к концу года доля предприятий, заинтересованных в приобретении средств BI, увеличится c 47 до 62%. Однако, по мнению аналитической компании SPEX, к настоящему времени ни один поставщик BI-решений не стал безусловным лидером рынка. Это свидетельствует о жесткой конкурентной борьбе среди поставщиков продуктов для бизнес-анализа и является залогом дальнейшего совершенствования BI-платформ. Уже сегодня рынок BI так широк, что каждая компания может выбрать продукт, максимально соответствующий ее текущим потребностям и позволяющий расширять функциональность по мере роста бизнеса.
С автором, менеджером по маркетингу компании Intersoft Lab, можно связаться по e-mail: mironov@iso.ru.