Сергей Дунаев
Основные инвестиции в разработку программного обеспечения, по крайней мере в США, направляются на разработку систем для электронной коммерции, быстродействующих систем для связи Internet, информационно-аналитических систем для поддержки принятия решений, извлечения и добычи данных. К слову сказать, и обыкновенные Web-узлы могут приносить неплохие дивиденды. Например, часто и даже принудительно посещаемый узел корпорации Netscape принес компании 97 млн. долл. дохода, а у нас создатели популярных Web-страничек иногда даже и не знают, что провайдер должен им регулярно платить за выбираемые от них килобайты, потому что, перепродавая их своим клиентам, он должен получать лишь процент от посреднических услуг. Впрочем, тут все зависит от условий договора.
Вообще полезная и содержательная информация стала очень цениться в последнее время. После того как исчезли печатные машинки, любой документ, а уж тем более таблица с цифрами становятся неуничтожимыми электронными объектами, элементами базы данных или хранилища данных (DW - Data Warehouse), доступными для многостороннего и многомерного анализа с помощью специальных средств. Идеи, сформулированные еще в 70-е годы Е. Ф. Коддом и впоследствии развитые Б. Инмоном, получили в наши дни блестящие решения. Витрины, киоски и склады данных, информационные хранилища - все это термины сегодняшнего дня. Теперь уже редко кто, прежде чем принять решение, копается в ворохах таблиц справок и отчетов. Информация выкладывается руководителю в таком виде, что он может рассматривать ее в различных сечениях и поворотах на любом временном отрезке при любом сочетании параметров, как сквозь магический кристалл. Почти все крупнейшие производители СУБД предлагают свои решения и средства для разработки полноценных OLAP-систем (Online Analytical Processing).
Если раньше разработкой подобных систем занимались только выдающиеся коллективы, подобные SAS Institute, то теперь массовые решения для публики предлагает даже Microsoft, разбогатевшая, как мы помним, на успехе Бейсика, DOS и текстового редактора, которые до сих пор не вышли из моды. Следует полагать, что многие услышат об OLAP именно в связи с Microsoft и будут думать, что именно этой фирме принадлежат решающие инициативы в деле развития и процветания OLAP и Data Mining. Что поделаешь, по определению Герберта Маркузе, в эпоху массового сознания у одномерного человека короткая память, даже если он и занимается многомерными базами.
Во всяком случае, серьезность своих намерений Microsoft уже продемонстрировала рядом вполне впечатляющих акций. Во-первых, заканчивается бета-тестирование принципиально нового интерфейса OLE DB for OLAP. Последний интересен сам по себе как чрезвычайно перспективный стандарт (ведь и ODBC, как известно, был впервые предложен компанией Microsoft), а тут он действует как набор API-интерфейсов для связи клиентов OLAP с серверами OLAP. О поддержке механизма нового API сразу заявили фирмы Cognos и Brio Technology. Другие производители серверов, такие, как Sybase и Arbor System, скорее всего, примут его. SAS Institute, IQ Software, Business Object также сообщили о поддержке OLE DB. Oracle не придумала ничего лучшего, как начать войну стандартов, предложив свой собственный OLAP-интерфейс, который называется Multidimensional API и у которого оказалось гораздо меньше сторонников. Дело в том, что такие стандарты очень нужны, ибо в современных базах, благодаря инкапсулированию в них виртуальной Java-машины (JVM) или использованию технологии ActiveX, данные могут сохраняться в виде объектов с наследуемыми свойствами и методами управления: эта технология идет на смену примитивному механизму BLOB’ов - больших бинарных объектов, которые ныне используются в БД для хранения графических и мультимедийных данных. Те, кто считает, будто чисто реляционные СУБД вместе с двух- и трехзвенными приложениями типа клиент-сервер будут существовать вечно, могут попасть впросак, потому что на смену этим устаревшим технологиям уже сейчас приходят распределенные объектно-ориентированные системы, базирующиеся на стандартах DCOM или CORBA, и объектно-реляционные СУБД. Не исключено, что со временем они превратятся в единственную реальность.
Именно в этом направлении развивает Microsoft свой MS SQL Server, который начиная с версии 7.0 станет объектно-ориентированным. Ведущие менеджеры Microsoft, по их собственным сообщениям, собираются объединить все лучшее, что накоплено в OLAP-технологиях, и создать собственную OLAP-систему с интуитивным интерфейсом и тесной интеграцией с SQL-сервером. Но для этого нужно пройти слишком большой путь. Ключевой представляется проблема создания средств для построения аналитических моделей и администрирования Data Warehouse. Здесь пока не найдены какие-либо типовые решения и стандарты. Например, SAS Institute в своей новой версии хранилища данных Scalable Performance Data Server (SPDS) ввел службу поддержки имен и многосерверную архитектуру, а также реализовал разбиение файлов большого размера для наиболее оптимального управления доступом. Microsoft имеет лишь то преимущество перед другими компаниями, что начала это позже всех и сможет использовать WWW, Internet/intanet и объектно-ориентированные технологии в качестве OLAP-среды.
С другой стороны, Informix занимается этими проблемами чуть ли не с момента своего зарождения и, по словам руководителя компании Роберта Финоккио, опережает Microsoft на несколько лет. 6 апреля в Менло-Парке, Калифорния, было объявлено о новом расширении Informix Online Dynamic Server опцией Advanced Decision Support Option. Сейчас ни один производитель не предлагает единую РСУБД, способную поддерживать как киоски данных небольшого объема, так и крупнейшие хранилища данных для больших организаций. Сочетание Informix Dynamic Server Advanced Decision Support Option, Extended Parallel Option и MetaCube (ROLAP) Option дает пользователям возможность строить небольшие киоски данных и доводить их по мере необходимости до уровня хранилищ данных объемом в несколько терабайт. Новая опция Informix обладает рядом передовых возможностей. В их числе: функции разделения данных и индексов, включая гибридное разделение, ускоряющие поиск релевантных данных; побитовое индексирование и индексирование с обобщенным ключом; новые технологии обработки сложных запросов с помощью многомерного анализа Star Schema; улучшенные инструменты администрирования, рассчитанные на требования, которые возникают при управлении как киоском, так и складом данных.
Интересно и еще одно обстоятельство: если раньше OLAP-системы создавались исключительно для анализа закрытой корпоративной информации, то теперь они все больше проникают в открытый мир WWW. Этому способствуют новый инструментарий, новые интерфейсы, новые стандарты. Судя по всему, вмешательство Microsoft в игру на рынке OLAP обострило конкуренцию между производителями. Если так пойдет и дальше, то уже к 2000 г. не только руководители крупных корпораций, но и обыкновенные посетители Web-узлов смогут воспользоваться инструментами анализа для того, чтобы построить информационный гиперкуб в соответствии со своими потребностями и на базе терабайтных хранилищ данных самых разнообразных типов, в том числе и мультимедийных, самодвижущихся, самораскрывающихся и еще Бог знает каких. Вероятнее всего, сначала это произойдет на финансовых и биржевых рынках, а уже потом будут предлагаться инструменты анализа для оценки рынка потребительских товаров и услуг как в глобальном интернациональном масштабе, так и с разбивкой по странам и регионам.
С автором можно связаться по адресу: sbd@polytech.ivanovo.su.