После того как несколько лет назад произошла стабилизация мирового рынка СУБД, выразившаяся в доминировании на нем трех игроков — Oracle, IBM и Microsoft, остальные вендоры остались вне зоны пристального внимания общественности. И, по-видимому, зря: мало того, что их продукты по-прежнему широко и с успехом используются в самых разных отраслях, эти вендоры имеют собственные представления о направлениях развития данного сегмента и разрабатывают соответствующие технологии. Об этом лишний раз напомнил семинар, организованный российским представительством компании Sybase и проведенный ее ведущим экспертом Робом Вершуром.
Следует признать, что во многом тенденции, отмечаемые экспертом Sybase, уже достаточно отчетливо проявились и находят отражение в продуктах многих игроков данного рынка. Предполагается, что в будущем основой корпоративной ИС станут именно данные, причем они не должны принадлежать отдельным приложениям: доступ к ним следует сделать прозрачным и масштабируемым для любых систем -- как уже существующих, так и тех, что могут когда-либо появиться на предприятии. Реализацию такого подхода стимулируют и технологические инновации, в числе которых появление многоядерных архитектур, резкое снижение стоимости дисковой и оперативной памяти, широкое распространение твердотельных (SSD) и флэш-накопителей, увеличение пропускной способности сетевых соединений (в том числе беспроводных), рост популярности мобильных устройств и т. д.
При этом, хотя перспективность технологий grid и виртуализации уже никем сомнению не подвергается, конкретные подходы к их реализации являются предметом дискуссий. К примеру, монолитным многопроцессорным SMP-системам противопоставляются кластеры из недорогих компонентов, а размещению всей БД в оперативной памяти — системы хранения на базе SSD. На решение подобных задач ориентированы также новые модели развертывания приложений и вычислительной обработки, такие как SOA, виртуализация и облачные вычисления.
Если же обратиться к задаче управления данными, то сегодня они во многих случаях находятся в географически распределенных системах, а требования к скорости доступа к ним постоянно ужесточаются. Аналитическая обработка постепенно теряет исключительно ретроспективный характер: все чаще она производится не для генерации отчетов, а выполняется в реальном времени как составной элемент сложной транзакции. Нередко появляется потребность в высокоскоростной потоковой обработке данных, которые еще не успели попасть в БД. Такие задачи возникают при мониторинге сетевого трафика, управлении массивами сенсоров (таких, например, как RFID), финансовом трейдинге, обработке телефонных вызовов, анализе поведения в процессе Web-серфинга и т. д.
В качестве иллюстрации Роб Вершур привел комплексное решение Sybase Risk Analytics Platform (RAP) для управления рисками в финансовом трейдинге, объединяющее в себе инструменты для поточной обработки сложных событий (Complex Event Processing, CEP), традиционную реляционную СУБД Sybase Adaptive Server Enterprise (ASE) и аналитическое хранилище на базе Sybase IQ. Первый из этих инструментов служит для обработки данных, допускающей лишь миллисекундные задержки; второй используется тогда, когда время реакции может достигать секунд, а третий применяется в аналитических процедурах, требующих минут и даже часов. Все три указанных инструмента действуют параллельно, но не изолированно друг от друга, постоянно обмениваясь теми или иными данными. Как пояснил Роб Вершур, с точки зрения СУБД поток представляет собой таблицу неограниченной длины, а для обработки берутся отдельные ее фрагменты, называемые окнами. Само окно может быть скользящим, а его размер определяется либо заданным числом записей, либо фиксированным временным интервалом.
Участники семинара получили также подробную информацию о новшествах, реализованных в последних версиях популярных продуктов компании Sybase, таких как ASE, Replication Server и Sybase IQ. Здесь стоит отметить, что начиная с 2007 г. компания предлагает собственную редакцию кластерной СУБД ASE Cluster Edition с разделяемой дисковой подсистемой, которая способна составить конкуренцию построенной в той же архитектуре Oracle Real Application Cluster. В решении Sybase в физических узлах кластера запускается по нескольку экземпляров СУБД ASE (до 32), которые, в свою очередь, в различных сочетаниях группируются в логические кластеры, причем в одном таком кластере могут работать экземпляры серверов БД, расположенные на разных физических машинах. Все это позволяет виртуализировать ресурсы СУБД и гибко маневрировать ими как с целью повышения отказоустойчивости, так и для балансировки нагрузки.