БИЗНЕС-АНАЛИТИКА
Одно из наиболее актуальных направлений развития СУБД - расширение их возможностей в область бизнес-анализа (Business Intelligence, BI). В Microsoft SQL Server первые BI-средства - Analysis Services (AS) для построения OLAP-кубов - появились еще в версии 7.0, а затем, после выпуска SQL Server 2000, последовательно дополнялись другими механизмами и инструментами. Последним из них стало ПО Reporting Services для управления отчетами (см. PC Week/RE, N 7/2004, с. 35). Представляя несколько месяцев назад первую бета-версию будущего варианта MS SQL Server 2005*, ранее известного под кодовым названием Yukon, Microsoft объявила, что основные задачи новой BI-системы - интеграция в единый комплекс всего BI-инструментария, а также предложение средств, обеспечивающих простую и быструю разработку BI-решений для широкого круга пользователей.
В настоящее время BI-платформа Microsoft включает пять основных компонентов:
- SQL Server Relational Database - создание реляционных баз данных;
- Analysis Services - разработка многомерных кубов;
- Data Transformation Services - извлечение, преобразование и загрузка данных из первичных источников информации в хранилище;
- Reporting Services - управление отчетами, создаваемыми на основе реляционных или многомерных баз данных;
- Data Mining - извлечение данных на основе набора предопределенных алгоритмов.
Среди отдельных компонентов BI 2005 наибольшему обновлению подверглись Analysis Sevices (рис. 1), что вполне естественно, так как другие средства были выпущены недавно. Именно поэтому ниже мы рассмотрим основные новшества AS 2005 Beta 1 по сравнению с AS 2000.
Рис. 1. Архитектура Analysis Services использует комбинацию различных технологий
Инструментальные средства
Непосредственно для работы с OLAP-кубами (создание и управление) в AS 2000 применяется средство Analysis Manager 2000 (AM 2000). Кроме того, используются еще два инструмента, входящие в состав SQL Server 2000 - Query Analyzer и Enterprise Manager, предназначенные для разработки базовых схем формирования кубов, процедур загрузки и трансформации данных (Extract Transform and Load, ETL), служб преобразования данных (Data Transformation Services, DTS).
Все эти три программных средства являются автономными, они имеют непохожие пользовательские интерфейсы и не полностью соответствуют современным стандартам разработки ПО. Поэтому они заменены в AS 2005 на два новых инструмента - BI Workbench и SQL Workbench, построенных на базе интегрированной среды Visual Studio 2005 IDE. Пакету BI Workbench (см. таблицу) отводится основная роль в создании BI-решений, он полностью реализует функциональность AM 2000, добавляя к ней возможности загрузки и преобразования информации, управления отчетами и извлечения знаний. SQL Workbench включает функции, ранее реализованные в Query Analyzer и Enterprise Manager, а также некоторые средства администрирования, имеющиеся в AM 2000.
Таблица. Интегрированная среда BI Workbench. Новые возможности BI Workbench по сравнению с Analysis Manager 2000
Архитектурные изменения
В AS 2000 работа с кубами базировалась исключительно на применении реляционных звездообразных схем в качестве источника данных. AS 2005 с помощью нового механизма Data Source View (DSV) может представлять структуру кубов в виде атрибутивных схем. Это обеспечивает повышение гибкости обработки данных, в том числе возможность отслеживания обратных связей между кубами и рабочими базами данных. В то же время DSV позволяют работать со структурами кубов без их непосредственного соединения с источниками данных.
AS 2005 использует новую технологию Unified Dimensional Model (UDM), которая представляет собой комбинированный механизм доступа к реляционным БД и многомерным OLAP-кубам. Ее применение снимает традиционное различие между организацией работы с OLAP-данными и стандартными отчетами. Среди новшеств UDM можно выделить следующие функции:
- управление размерностями на базе атрибутов. В AS 2000 можно было использовать только одну иерархическую структуру управления размерностями, что ограничивало, в частности, возможности анализа данных в различных разрезах. В AS 2005 модель размерностей может быть простым набором атрибутов, не обязательно связанных иерархическими связями. Это позволяет динамически создавать нужные комбинации данных. Например, размерность "Пользователь" может включать десятки демографических параметров, которые могут быть представлены в виде различных иерархий, например (страна - область - город) или (город - возраст - пол);
- сложные типы размерностей. В то время как в AS 2000 все размерности должны быть структурированы в виде звездообразных или родительских схем, AS 2005 дополнительно поддерживает в качестве размерности такие типы, как роли, ссылки и множественные связи (не все эти возможности поддерживаются в Beta 1);
- новые архитектурные возможности AS 2005 позволяют создавать кубы сложной структуры, навигация по ним становится трудной и не очень удобной. Эта проблема решается с помощью "перспектив" (Perspectives) - именованных групп размерностей и мер, которые позволяют создавать различные варианты представления одного и того же куба для разных категорий пользователей;
- группы мер. В AS 2005 несколько разнородных таблиц могут быть объединены в единый куб, с которым можно работать с помощью коллекций мер, в том числе совместно перспективами.
AS 2000 поддерживает вычисление и кэширование как на сервере, так и на клиенте. Новая версия выполняет эти операции только на серверной стороне. Microsoft считает, что это упрощает задачи управления системой и ее интеграции с другими решениями. Кроме того, в AS 2005 включено несколько новых утилит для автоматизации операций конфигурирования и развертывания (при развертывании AS 2000 на различных аппаратных средах требовалось ручное управление настройками источников данных и кубов).
Рис. 2. Окно управления аналитическими службами
Изменения в программной модели
Модель программирования AS2005 включает значительный набор новых и модернизированных функций. Большинство из них описаны лишь в документации и не включены в Beta 1, но все же имеет смысл сейчас сказать и о них.
- Существенно упрощена вычислительная модель AS 2005, которая теперь позволяет применять MDX-скрипты (MultiDementions eXpression). Помимо упрощения собственно программирования и улучшения контроля доступа к данным это дает возможность пошаговой отладки, чего в предыдущих версиях не было. Результаты расчетов могут быть кэшированы для повышения скорости обработки последующих запросов.
- В AS 2000 хранимые процедуры должны были оформлены в виде COM-классов, в новой версии они могут быть написаны на любом CLR-языке для выполнения в среде .NET Framework.
- Для таких обычных, но создающих немало проблем операций, как конвертация валют, преобразование единиц измерения и пр., можно использовать BI-мастер и шаблоны вычисляемых мер.
- Программируемые BI-объекты допускается создавать с помощью технологий Analysis Management Objects.
- При использовании AS 2000 разработчики почти не имели возможностей для получения низкоуровневой информации о событиях, происходящих на AS-сервере. AS 2005 производит трассировку событий, эти данные могут использоваться для мониторинга и анализа с помощью SQL Server Profiler.
- Программирование пользовательского интерфейса AS 2005 выполняется с помощью специализированного языка разметки XML for Analysis.
- AS 2005 включает механизм перевода, который позволяет представлять один и тот же куб на разных национальных языках.
Как уже говорилось в начале статьи, Analysis Sevices - один из ключевых элементов BI-платформы SQL Server 2005. Существенной модернизации подверглись и другие BI-компоненты, однако их новшества имеет смысл детальнее рассмотреть после выпуска второй бета-версии продукта, которая должна появиться в ближайшее время.