Компания SAP располагает в настоящее время набором различных аналитических (BI) технологий, включая технологии фирмы Sybase, приобретенной ею два года назад. Объявлена и реализуется программа развития и объединения этих технологий, но уже сейчас совместное их использование заслуживает внимания российских ИТ-специалистов, и 18 апреля представительство Sybase CIS провело семинар “Архитектура высокопроизводительной BI-системы. От теории к практике”, на котором был сделан акцент на использовании существующих возможностей аналитических технологий Sybase и SAP.
Андрей Хромов, ведущий технический консультант Sybase CIS, представил Sybase IQ, специализированный на аналитической обработке сервер баз данных. Как он утверждает, этот сервер выполняет запросы к базе данных в 10--100 раз быстрее, использует для хранения данных в несколько раз меньше памяти (на основе поколоночного хранения), чем “обычный” сервер баз данных, и т. д.
В последние годы Sybase IQ развивается для максимального использования параллельных архитектур типа grid/MPP, анализа неструктурированных данных (полнотекстовый поиск, поиск по логическим условиям и степени подобия), исполнения алгоритмов Data Mining на стороне хранилища. В целом всё это позволяет позиционировать Sybase IQ как сервер для “больших данных”.
Утверждается, что практически каждое поле в хранилище, управляемом Sybase IQ, можно индексировать. То есть возможен запрос любой структуры, который будет быстро выполняться… Поэтому хранилище, управляемое сервером Sybase IQ, полагает г-н Хромов, может заменить хранилище данных, управляемое “обычным” сервером баз данных, плюс витрины данных и OLAP-кубы. Очевидно, во многих (но не во всех) случаях такой подход работает, Sybase IQ на рынке с 1994 г., этот продукт используют тысячи организаций.
Сейчас Sybase и SAP рекомендуют такую схему организации аналитической обработки:
- источники первичных (транзационных) данных — базы данных АБС, ERP- и CRM-систем и т. д.;
- перенос первичных данных в хранилище. Для этого предлагается использовать традиционные ETL-средства: BusinessObjects Data Services компании SAP или ETL-средства других компаний. Но вместо них или наряду с ними теперь предлагается Sybase Replication Server, который немедленно, в режиме реального времени, реплицирует данные, введенные в базы транзакционных систем, в хранилище. Но при этом невозможен такой контроль и преобразование данных, как при применении ETL-средств;
- хранилище, управляемое Sybase IQ. Это хранилище может быть построено по модели данных, спроектированной пользователем, либо по отраслевой модели данных Sybase (для телекома, банков и др. отраслей) — Sybase IWS;
- визуализация данных и формирование отчетов средствами аналитических платформ BusinessObjects, Cognos, Microstrategy и др. Причем на этом этапе можно использовать мобильные решения Sybase (Sybase Afaria и др.) для безопасного доступа с мобильных устройств.
Алексей Кулаков, архитектор бизнес-решений SAP CIS, рассказал о версии 4.0 аналитической платформы SAP BusinessObjects BI Platform. Основные новшества этой версии — интеграция с приложениями SAP, обеспечение прямого доступа с мобильных устройств к важным метрикам и отчетам, объединение со средствами работы с социальными сетями (SAP StreamWork). Усовершенствованы средства получения отчетов (SAP Crystal Reports), формирование дашбордов и интерактивной отчетности, введена интеграция с MS SharePoint.
Сергей Заблодский, руководитель отделения корпоративных решений IBS, проанализировал практику проектов по созданию аналитических систем, которая весьма отличаются от рекомендуемых схем. На это, отметил он, есть методические, организационные и технологические причины. Что касается последних, то г-н Заблодский выделил недостаточную производительность хранилищ данных, что не позволяет загружать в них все детальные данные; вместо них загружаются агрегированные (на их основе) данные. И при анализе это не позволяет дойти до конца, обнаружить конкретную причину отклонения … Кроме того, громоздкость технологических процессов загрузки данных сначала в хранилище, а из него -- в витрины данных приводит к тому, что часть данных попадает в витрины, минуя хранилище. Возникает несогласованность данных, которая также обязательно проявляется.
Громоздкость технологических процессов во многом обусловлена несогласованностью используемых инструментов, работающих каждый со своими метаданными. В этом контексте Сергей Заблодский с оптимизмом оценил развитие аналитических инструментов Sybase и SAP, которое решает отмеченные им проблемы.
Григорий Ципес, главный консультант департамента управленческого консалтинга IBS, остановился на методических аспектах проекта по созданию аналитической системы. Хотя в основе лежат общепринятые понятия и методики — показатели, цели, факторы успеха, стратегическая карта, система сбалансированных показателей и т. д., их применение и доведение до детализированного состояния, когда за дело берутся ИТ-специалисты, является неочевидным и творческим процессом, что Григорий Ципес успешно показал.