Джефф Моуд
Хранилище контрольных данных о биржевых операциях помогает соблюдать правила торговли ценными бумагами
Если бы наш мир был более совершенным, руководству Национальной ассоциации дилеров ценных бумаг (National Association of Securities Dealers - NASD, Роквилл, шт. Мэриленд) не пришлось бы беспокоиться насчет мошенников, пытающихся обмануть систему. Однако, как это слишком хорошо известно служащим NASD, от совершенства он пока что далек. “К сожалению, нехорошие люди еще встречаются, - вздыхает Билл Боун, вице-президент NASD по стратегическим технологическим службам. - Наша работа состоит в том, чтобы не сводить с них глаз и немедленно реагировать на проблемы, связанные с нарушением правил торгов”.
NASD является учредителем NASDAQ, биржи, интенсивная деятельность которой известна всем. Поскольку имеется 550 000 зарегистрированных биржевых маклеров, ежедневно покупающих и продающих на NASDAQ около 700 млн. акций, работу Боуну приходится выполнять немаленькую. Иногда, например во время пертурбаций рынка, произошедших в октябре, количество операций купли-продажи акций взлетает до небес. Чтобы вся эта деятельность велась в рамках правил, Боун и его сотрудники строят одно из крупнейших и наиболее сложных из имеющихся архитектур промышленных хранилищ данных. Хранилище контрольных данных о биржевых операциях NASD предоставляет регуляторам рынка доступ к огромным массивам - 1,4 Тб, и этот объем ежедневно возрастает на 4 Гб. Фактически хранилище обеспечивает выдачу некоторых контрольных отчетов официальным лицам не позже, чем через 30 минут после закрытия торгов.
Боун из NASD: “Нехорошие люди пока что встречаются. Наша работа -не спускать с них глаз”
Это гораздо лучше того, что контролеры рынка имели раньше, пока NASD не начала в 1994 г. формировать хранилище. Тогда стандартная технология NASD предполагала передачу транзакций в рабочий архив данных, а затем использование статистических инструментов фирмы SAS Institute для их анализа. Время выдачи информации даже для простых отчетов составляло около 24 часов, а на обработку сложного запроса для организации Securities and Exchange Commission (Комиссия по ценным бумагам и биржам) могло уйти два месяца.
Эксперты утверждают, что немного найдется хранилищ данных, способных соперничать с хранилищем контрольной информации NASD по размерам и близости режима работы к реальному времени. “Некоторые крупные компании, работающие с ценными бумагами, пытались создать аналогичные системы для оперативного выявления рыночных тенденций, - рассказывает Клаудиа Имхофф, консультант по хранилищам данных из фирмы Intelligent Solution (Боулдер, шт. Колорадо). - Но проект NASD определенно производит наибольшее впечатление”.
Способность более оперативно анализировать информацию о биржевых операциях, очевидно, приносит свои дивиденды. В прошлом году мониторы NASDAQ отследили 26 305 случаев возможных нарушений регламента торгов, в том числе запрещенного правилами биржи осуществления сделок ее сотрудниками, что повлекло за собой соответствующие расследования. Сравните это с 18 154 выявленными нарушениями в 1992 г.
Выявление тенденций
В центре хранилища контрольных данных NASD лежит 16-процессорная система NUMA-Q (технология Non-Uniform Memory Architecture - архитектура неоднородной памяти), на которой работает СУБД Oracle7. Используя программы, разработанные в компании с помощью инструмента Composer фирмы Sterling Software, NASD преобразует транзакционные данные из нескольких источников информации о рынках и загружает их в хранилище. Здесь они соединяются с внешними данными, например со свежей информацией о событиях, способных существенно повлиять на рынок, или с данными о профилях биржевых маклеров. Затем с помощью визуального анализа, распознавания образов и других современных инструментов извлечения данных, выпускаемых такими производителями, как фирма SRA International (Арлингтон, шт. Виргиния), NASD может оперативно анализировать рынок в целом и выделять подозрительные тенденции в совершаемых торговых операциях.
Чтобы позволить аналитикам углубиться в специфические прикладные области, NASD сейчас занимается выделением ряда специализированных киосков данных из хранилища. Киоски данных - функционирующие на серверах SPARC 200 SMP (symmetric multiprocessing - симметричная многопроцессорная обработка) фирмы Sun Microsystems или, в некоторых случаях, на той же аппаратуре NUMA-Q, что и само хранилище, - дают аналитикам возможность исследовать информацию по последним совершенным сделкам, профилям участников торгов и другим разделам. В этих киосках использовано множество различных инструментов онлайновой аналитической обработки, в том числе Essbase корпорации Arbor Software, Express корпорации Oracle и ПО корпорации Cognos. Киоски тесно связаны с основным хранилищем, так как они используют одну и ту же модель данных, подготовленную с помощью инструмента работы со словарями данных фирмы Platinum Technology.
Уже сейчас весьма сложная, архитектура хранилища контрольных данных NASD в ближайшем будущем будет еще более расширяться. NASD планирует не только продолжить выделение из хранилища новых киосков данных, но и увеличивать количество пользователей. В этом году внутренний доступ возрастет с 25 до 500 пользователей, утверждает Боун. Кроме того, скоро NASD предоставит в качестве платной услуги онлайновый доступ к информации хранилища для клиентов NASDAQ, например для брокерских фирм.
Сначала, однако, NASD придется “подпереть” некоторые компоненты хранилища. Помимо создания системы онлайновой работы с векселями компания должна обеспечить повышенную безопасность. В настоящий момент, как рассказал Боун, наряду с прочими продуктами NASD изучает пакет безопасности Entrust фирмы Hewlett-Packard. И поскольку хранилище будет становиться все более важным компонентом бизнеса как для NASD, так и для ее клиентов, компания встанет перед необходимостью повышения его надежности и отказоустойчивости. “В частности, нам нужно усовершенствовать процессы резервного копирования и восстановления”, - считает Боун.
Чтобы достичь поставленных целей, NASD планирует обновить свою реляционную СУБД до версии Oracle8, оснащенной улучшенными по сравнению с предыдущей версией утилитами резервного копирования и восстановления. Компания также работает с фирмой Sequent Computer Systems и с корпорацией EMC в рамках недавно объявленной ими программы действий Data Center 2000.
“Надежности в области хранилищ данных мы должны уделять не меньше времени, чем для транзакционных систем, - говорит Боун. - А причина тому - несовершенство мира, в котором “нехорошие люди” всегда готовы воспользоваться любыми нашими промахами”.
NASD
Задача: поскольку рынок NASDAQ продолжал расти, руководство NASD осознало необходимость создания системы, помогающей бороться с нарушениями правил биржевых операций, которые допускают некоторые маклеры
Решение: NASD построила крупное хранилище данных и ряд киосков данных, которые позволяют контролерам быстро выявлять потенциальные нарушения и начинать расследования. Аналитики могут получить информацию о сделках всего за 30 минут - в старой системе для этого требовалось 24 часа.
Оборудование/программные средства: NASD построила хранилище данных объемом 1,7 Тб на базе СУБД Oracle7 и мощной системы, использующей архитектуру неоднородной памяти фирмы Sequent Computer Systems. Анализ в основном проводится с помощью инструментов добычи данных на базе деревьев решений и нейронных сетей.
Текущее состояние: NASD увеличивает число киосков данных и будет предоставлять платный доступ к подмножествам данных из хранилища.