Компания SAS осталась одним из немногих лидеров рынка бизнес-аналитики, которому удалось избежать поглощения более крупным вендором. Ее всегда отличало внимание как к базовым технологиям, так и к сложным отраслевым приложениям, использующим самые передовые аналитические инструменты. Директор глобальной технологической практики SAS Марк Торр ответил на вопросы научного редактора PC Week/RE Сергея Свинарева.
PC WEEK: В результате слияний и поглощений многие конкуренты SAS получили в свое распоряжение новые технологии, такие как СУБД с поколоночным (column-based) хранением таблиц и обработкой данных в оперативной памяти (in-memory), виртуализация, облачные сервисы и т. д. Какова позиция SAS по отношению к подобным направлениям?
Марк Торр: Многие из названных вами технологий не столь уж новы. К примеру, column-based СУБД присутствуют на рынке много лет. У нас есть сопоставимый по производительности сервер БД SAS Scalable Performance Data Server, но он не использует технологию column-based. Мы считаем, что она хороша только в тех случаях, когда число пользователей системы не очень велико. Сегодня у нас нет планов по развитию технологии column-based, но, разумеется, мы делаем все, чтобы наши продукты могли взаимодействовать с подобными источниками данных.
Мы рассматриваем разные варианты реализации высокопроизводительных вычислений. Один из них основан на grid-архитектуре, позволяющей распределить вычислительную нагрузку между множеством компьютеров. Сложность здесь заключается в том, чтобы аналогичным образом распределить между grid-узлами и обрабатываемый массив данных. Недавно мы выпустили масштабируемый программно-аппаратный комплекс SAS High Performance Risk Appliance, базирующийся на такой архитектуре и предназначенный для оперативной оценки рисков.
PC WEEK: Ваши конкуренты, такие как SAP и Oracle, тоже предлагают свои программно-аппаратные комплексы — HANA и Exadata соответственно. Это глобальный тренд?
М. Т.: Оба упомянутых вами решения — это средства хранения и обработки данных. К этой же категории относятся изделия Netezza и DATAllegro, перешедшие недавно под контроль IBM и Microsoft соответственно. Первой на такой путь стала компания Teradata, а относительно недавно о своих планах по развитию аналогичной системы Neoview объявила и HP. Но SAS не намерена выходить на рынок поставщиков программно-аппаратных комплексов для управления БД. Мы имеем партнерские соглашения с такими вендорами, как Teradata, Netezza, IBM, позволяющие нам встраивать аналитические функции непосредственно в ядро их СУБД, что существенно повышает производительность продуктов SAS. Сегодня ведутся переговоры и с другими вендорами, в частности с Oracle. Но не все они одинаково легко принимают идею подобного партнерства, поскольку хотят продвигать всю линейку своих продуктов в виде единого стека. В то же время мы видим, что многим заказчикам такой стековый подход не очень нравится.
Наши программно-аппаратные комплексы, построенные в рамках упомянутых соглашений с IBM и Teradata, нацелены на решение прикладных аналитических задач. Таковы два наших продукта: Scoring Accelerator, осуществляющий скоринговые операции для Enterprise Miner, и Analytics Accelerator, позволяющий выполнять ряд аналитических процедур в ядре СУБД и заметно уменьшать за счет этого выборку данных, поступающих на вход прикладных алгоритмов SAS. Последнее решение доступно пока только на платформе Teradata.
Виртуализация — это очень широкая тема: можно говорить о виртуализации серверов, сетей, систем хранения, десктопов и т. д. Что касается наших продуктов, то многие заказчики требуют, чтобы наше ПО функционировало в виртуализированной среде, и мы даем им такую возможность, реализуя архитектуру с терминальным клиентом. В то же время для своих внутренних нужд мы используем технологию частного облака, в котором работают тысячи виртуальных машин. Часть этих решений мы предлагаем тем нашим клиентам, которые хотят получать вычислительные услуги по требованию (on demand) в общедоступном облаке. Для их предоставления мы построили три дата-центра: в Северной Каролине, а также в Голландии и Сингапуре.
Сейчас подобными облачными сервисами SAS пользуются около сотни компаний: 70 из США, остальные — из Европы; недавно появились клиенты из Азиатско-Тихоокеанского региона. Но российских компаний среди них пока нет.
PC WEEK: Какие облачные услуги SAS пользуются наибольшим спросом?
М. Т.: Это прежде всего генерация специальной отчетности, отвечающей всем требованиям регуляторных органов, для предприятий, занимающихся разработкой и выпуском новых лекарств. Они проводят цикл испытаний, отправляют их результаты в облако SAS, и мы формируем пул необходимой отчетной документации. Кроме того, все оптимизационные сервисы приобретенной нами полтора года назад фирмы IDeaS предоставляются в облачной среде. Вместе с тем спрос на генерацию стандартной отчетности в облаке не велик. А если соответствующая задача к тому же может быть решена средствами Excel, то, думаю, мало кто захочет выносить ее на облако.
PC WEEK: Казалось бы, удобнее всего анализировать в облаке информацию, получаемую из социальных сетей. Ведь она уже общедоступна.
М. Т.: Да, вы правы. И, кстати, сервис, основанный на нашем новом продукте Social Media Analytics, уже доступен по модели on demand. Один из первых заказчиков — промышленное предприятие, которое захотело проанализировать, что говорят о его изделиях участники сетевых сообществ, чем они недовольны. По результатам подобного исследования принимается решение: изменить конструкцию, скорректировать маркетинговую кампанию и т. д. Еще одно возможное применение этого сервиса — предварительное зондирование покупательской аудитории. Здесь открывается широкий фронт работ, поскольку все чаще языком сетевого общения становится видео, а следовательно, придется применять не только технологии text mining, но и проводить аналогичный анализ аудио- и видеоконтента.
PC WEEK: Спасибо за беседу.