Заметки из лаборатории
PowerMart 3.0 корпорации Informatica предоставляет поддержку более широкого ряда баз данных и ОС, чем конкурирующие системы
PowerMart корпорации Informatica не предоставляет обещанного готового решения по хранению данных, но позволяет широкому кругу организаций быстро создавать рынки данных (datamarts) для поддержки решений без необходимости писать код или нанимать дорогих консультантов, благодаря чему этот пакет является заметным достижением на рынке хранилищ данных.
PowerMart 3.0, первая внешняя версия пакета, предлагает интегрированный набор инструментов для управления извлечением, преобразованием и загрузкой исходных данных в тематически-ориентированные рынки данных.
Этот пакет, выпущенный в мае, соперничает с Visual Warehouse корпорации IBM, но более прост в использовании и поддерживает большее число операционных систем и баз данных: PowerMart выполняется на платформах Windows NT и Unix и имеет встроенные драйверы, поддерживающие большинство популярных баз данных на SQL. Visual Warehouse выполняется только под OS/2 и имеет ограниченную поддержку баз данных формата, отличного от DB2.
Однако, подобно Visual Warehouse, PowerMart недостает инструментов фильтрации и анализа данных. Организации, нуждающиеся в таких возможностях, будут вынуждены обратиться к сторонним фирмам или выполнить написание заказного кода для анализа и очистки "грязных" данных или добавления таких услуг, как геокодирование адресов.
К тому же цены на PowerMart "кусаются": начальная цена NT-версии составляет $45000 за один источник данных и целевую платформу. Начальная цена Unix-версии - $65000. Каждая дополнительная платформа баз данных стоит $20000.
Для сравнения: начальная цена Visual Warehouse корпорации IBM - $19950.
Краеугольные камни
PowerMart состоит из трех 32-разрядных клиентских инструментов администрирования, выполняющихся под Windows NT или Windows 95, и модуля преобразования, который работает на NT- или Unix-серверах.
Клиент Repository Manager создает репозиторий метаданных, Designer - целевую базу данных и отображает преобразование источника, а Server Manager составляет расписание сеансов преобразования и отслеживает их. Модуль Server выполняет сеансы преобразования для извлечения исходных данных и загрузки их на рынок данных.
Чтобы загрузить исходные табличные данные из базы данных SQL Server корпорации Microsoft в репозиторий, мы воспользовались средством Source Analyzer модуля Designer системы PowerMart.
Для создания целевых таблиц рынка данных мы скопировали и отредактировали определения исходных данных. Мы также создали некоторые таблицы рынка данных с нуля и воспользовались программой-мастером Star Schema системы PowerMart для того, чтобы с нуля составить полную схему рынка данных.
Затем мы использовали Designer для отображения преобразований между исходной и целевой таблицами.
Графический Designer системы PowerMart позволил нам, указывая на объект и щелкая
по нему (метод point-and-click), отображать схему преобразования источник-цель
Графический интерфейс и использование принципа "укажи и щелкни" (point-and-click) инструмента Designer упростили выполнение задачи по созданию рынка данных. Мы могли выбирать более чем из пятидесяти функций PowerMart для управления строками и числами и получения таких результирующих, как среднее арифметическое и сумма. Designer автоматически определял корректные реляционные соединения среди исходных таблиц.
Управление загрузкой данных
Мы использовали PowerMart Server Manager для составления расписания извлечения данных и сеансов преобразования. Мы могли назначить выполнение независимых сеансов на определенное время или объединять несколько сеансов в пакет так, чтобы один сеанс не мог запуститься, пока не закончится предыдущий.
Хотя можно задавать повторение сеансов определенное число раз или через фиксированные промежутки времени, PowerMart не позволяет устанавливать неравномерные интервалы времени. Например, нельзя назначить выполнение сеанса каждую ночь, исключая выходные дни.
Server Manager предлагает несколько возможностей для мониторинга сеансов. При обзоре сеансов отображается состояние (выполнения, завершенного процесса или ошибки) десяти последних запусков. При детальном обзоре сеанса отображается количество записей, загруженных в каждую таблицу целевого рынка данных.
Кроме того, PowerMart имеет журналы событий, ошибок и сеансов. Мы могли увидеть текущую историю деятельности PowerMart Server, системные сообщения об ошибках, а также время начала и остановки процесса и количество записей, обрабатываемых для каждой таблицы в отдельных сеансах.
Для обеспечения максимальной производительности PowerMart использует встроенные драйверы баз данных. Модуль Server генерирует SQL для чтения исходных данных и перезаписи конвертированных целевых данных из кэша, размещенного в оперативной памяти.
Во время преобразования не происходило никакого промежуточного дискового ввода-вывода. Для выполнения действительных преобразований данных модуль использует внутренние функции PowerMart вместо более медленных SQL-функций.
Извлечение 1333 записей из исходной базы данных, содержащей 220000 записей (18 Мб), и конвертирование в наш рынок данных заняли 24 с. Извлечение и конвертация всех 220000 записей заняли 45 мин.
Требуются расширенные знания
Для инсталляции PowerMart требуется опыт администрирования SQL-баз данных, а также административные привилегии на всех целевых серверах.
В дополнение к процедуре установки PowerMart нам пришлось использовать Enterprise Manager системы SQL Server, чтобы создать устройства и базы данных для репозитория PowerMart и целевых рынков данных, отследить TCP/IP-адрес сервера PowerMart и создать источники данных, соответствующие 32-разрядному интерфейсу открытого взаимодействия с базами данных (Open Database Connectivity) для наших баз данных по источникам данных, репозиториям и рынкам данных.
Лицензионный номер базы данных, который мы получили с пакетом, был неверным. Нам пришлось связаться с Informatica для получения правильного номера и затем отредактировать реестр Windows NT.
Три руководства и иллюстрированный путеводитель по PowerMart обеспечивают хорошее представление о продукте, в том числе в деталях. Однако отдельные шаги и диалоговые окна были пропущены в некоторых инструкциях, а изображения экрана и термины не всегда соответствовали действительным экранам.
Впрочем, всегда можно было получить контекстно-зависимую интерактивную помощь.
С пакетом поставляется отпечатанное обучающее руководство и SQL-сценарии для создания учебной базы данных. Хотя в руководстве имеется весь необходимый материал, инструкции могли бы быть более подробными. Нам пришлось выполнить определенную детективную работу, чтобы найти и выполнить сценарии установки, и в некоторых случаях в инструкциях была путаница относительно того, каким должен быть следующий шаг.
Джон Шумейт
С Джоном Шумейтом, который управляет конфигурированием предприятия крупного правительственного агентства, можно связаться по адресу: 76137.2526@compuserve.com.
Специальное сообщение
PowerMart может в конце сеанса отправить сообщение о состоянии в систему электронной почты, поддерживающую MAPI (интерфейс программирования приложений обмена сообщениями)
В работе
IBM готовит Windows NT-версию Visual Warehouse, выпуск которой намечен на IV квартал