В Москве в октябре прошел ежегодный, уже шестой по счету, SAS Forum, на котором обсуждались как проблематика обработки и анализа больших данных в целом, так и конкретные решения и продукты компании SAS, одного из лидеров мирового рынка BI. На ряд актуальных вопросов в сфере бизнес-аналитики ответил директор глобальной технологической практики SAS Марк Торр .

Какие инновационные решения были выпущены SAS на рынок в текущем году?

В июле нынешнего года появилась новая версия SAS 9.3, которую уже используют порядка двух тысяч клиентов. В рамках этой версии вышли новые релизы известных продуктов SAS — Enterprise Miner (среда для выявления внутренних закономерностей с целью поддержки принятия решений) и Forecast Server (позволяет очень быстро и в автоматическом режиме строить миллионы прогнозов с использованием графического интерфейса), а также реализованы новые технологии работы с базами данных.

Расскажите о программах компании в русле технологического партнерства.

Ситуация на рынке постоянно меняется. Компанию Netezza, как известно, приобрела корпорация IBM, Greenplum куплена EMC, Aster Data — компанией Teradata, но это не мешает нам развивать партнерские программы. В качестве примера можно привести пакет Scoring Accelerator, позволяющий эффективно использовать скоринговые модели, созданные с помощью Enterprise Miner, развертывая их непосредственно в среде базы данных. Год назад данный инструмент стал применим и в среде DB2 компании IBM. По итогам минувшего года данное решение внедрили порядка 340 компаний по всему миру, в том числе есть внедрение и в России (клиент — один из крупных банков). Помимо интеграции в среде данных Teradata и IBM, мы продвинулись в плане углубления интеграции с EMC Greenplum Database, так что EMC сегодня — один из крупных стратегических партнеров SAS.

Поговорим о новых технологиях. В чем преимущества технологии in-memory?

У технологии in-memory две области применения: загрузка данных в память с целью их визуализации и быстрое выполнение сложных аналитических задач при обработке миллиардов строк данных. Как результат — расчеты, занимавшие раньше много часов и даже несколько дней, могут быть выполнены за несколько минут, что позволяет в режиме реального времени менять модели, сценарии, делать прогнозы. Это существенно изменяет бизнес-процессы компании, повышая их скорость, эффективность и предсказуемость результатов. Одно из уже апробированных и внедряемых решений SAS с использованием расчетов по технологии in-memory — по кредитному скорингу. В ближайшее время будут анонсированы два новых аппаратно-программных комплекса, позволяющих на базе этой же технологии реализовать модели интеллектуального анализа данных (data mining), оптимизации на больших объемах данных.

Отметим еще, что для ускорения расчетов SAS использует наряду с in-memory и распределенные расчеты (GRID-технология).

Какие планы у компании по развитию облачного направления?

Данное направление у нас называется SAS On Demand, т. е. “по требованию”. Оно развивается по двум линиям — хостированные корпоративные сервисы (любая технология SAS может быть хостирована в облаке) и ПО как услуга (ограниченное число решений — порядка 15). Отличие в том, что в первом случае у компании гораздо больше возможностей по кастомизации, настройке сервисов под требования конкретного бизнеса, во втором случае предоставляется в основном стандартный набор сервисов.

Какие виды анализа предлагает SAS для работы с неструктурированной информацией?

Существует два вида анализа неструктурированных данных — анализ текстового документа (продукт SAS Text Analytics у нас уже давно есть) и исследование социальных медиа (новое решение Social Media Analytics). При анализе текста строятся кластеры из слов, используемых в документе, которые позволяют понять вещи, обсуждаемые в нем (люди, автомобили, страны), исследовать настроение, определить тон документа (позитивный, негативный, нейтральный) и многое другое. Решение Social Media Analytics позволяет брать данные из блогов, сайтов и анализировать их, используя для наглядности результаты исследования в виде диаграмм, панелей, видеороликов. Недавно в рамках обновления решения Social Media Analytics был запущен SAS Convert Center, который позволяет отслеживать через Twitter, что пишут люди, отвечать на их вопросы. Как результат — вы можете, например, проанализировав информацию от пользователей, не довольных вашим продуктом или сервисом, оперативно внести изменения в этот продукт или усовершенствовать услугу, изменить ценовую политику и пр.

Важно отметить, что начиная с версии SAS 9.3, линейка продуктов SAS Text Analytics и Social Media Analytics полностью поддерживает русский язык.

На прошлом Форуме вы подчеркивали, что эффективное управление данными — основа аналитики, и даже отметили, что SAS на управлении данными зарабатывает больше, чем на аналитике. Ситуация не изменилась?

Да, ситуация осталась прежней — эффективное управление данными остается для SAS приоритетным направлением, в которое мы активно инвестируем. По сути, управление данными — мощный фундамент, без которого не сможет эффективно работать многое из того, что мы предлагаем в области аналитики. По сравнению с прошлым годом наши продажи в данной сфере выросли на 60%. В платформе SAS 9.3 тоже имеется много обновлений по управлению данными на уровне инструментария (новые трансформации данных, лучшая отчетность, упрощенная загрузка больших объемов данных из СУБД Oracle). Для обеспечения качества клиентских данных, их анализа, очистки и интеграции в SAS 9.3 выходит новая версия DataFlux Data Management Studio. Это средство позволяет обеспечить комплексный подход к управлению данными и информационными потоками из единого интерфейса.

В начале будущего года будет также реализована поддержка системы Hadoop.

СПЕЦПРОЕКТ