Компания SAS представила в Москве два своих новых аналитических продукта — High Performance Analytics и Visual Analytics, в которых реализована прогрессивная технология выполнения аналитических расчетов и обработки данных в оперативной памяти серверов (in-memory).
Бизнес-аналитика и ее возможности
Согласно оценкам McKinsey Global Institute (MGI) и The Data Warehousing Institute (TDWI), приведенным Валерием Панкратовым, генеральным директором “SAS Россия/СНГ”, “большие данные” имеют три важных признака: стремительно растущий объем данных, их многообразие (документы, таблицы, электронная почта, СМС, данные измерительных приборов, видео, аудио и др.) и требование быстродействия при их обработке.
Бизнес-аналитику, работающую с “большими данными”, представитель SAS подразделил на простейшую (так называемую “реактивную”) и углубленную (“проактивную”). Реактивная аналитика, по его оценке, реализована в решениях многих разработчиков и широко представлена на рынке. Она включает, в частности, очистку данных, подготовку стандартных структурированных отчетов, нерегламентированных отчетов по запросам пользователей, глубокую детализацию данных с возможностью определения возникшей проблемы, выдачи предупреждений (т.н. alert’ов) в случае наступления определенных событий, а также возможность получения рекомендаций по дальнейшим действиям с целью ее разрешения.
Углубленная аналитика намного сложнее в реализации и представлена на рынке в значительно меньшей степени. Она подразумевает в числе прочего прогноз развития ситуации при условии сохранения выявленных трендов, выбор оптимального сценария развития ситуации, анализ текста и ряд других интеллектуальных аспектов. Решения SAS, подчеркнул г-н Панкратов, дают возможность именно углубленного анализа бизнес-информации, и в этом сегменте ИТ-рынка компания является доминирующим игроком, чьи решения находят применение в самых разных сферах бизнеса и государственного управления. Например, внедренное в банковской группе HSBC решение по противодействию мошенничеству позволяет эффективнее и точнее выявлять фрод по кредитным картам, британская компания-ритейлер Waitrose благодаря бизнес-анализу смогла снизить на 4% количество нереализованного товара, а сайту amazon.com удалось увеличить продажи за счет оперативного анализа покупательской активности и своевременной выдачи каждому посетителю обоснованных рекомендаций по совершению покупок.
Все большее применение находит бизнес-аналитика в государственных структурах. Так, по оценкам McKinsey Global Institute (MGI), которые озвучил Валерий Панкратов, применение современных технологий обработки “больших данных” в системе здравоохранения США приведет к повышению ее экономической эффективности (прогнозируемая экономия оценивается на уровне 300 млрд. долл. ежегодно), а государственные органы развитых стран Европы могут сохранить более чем 100 млрд. евро. В качестве практического результата, достигнутого в сфере здравоохранения путем обработки многолетних медицинских данных, г-н Панкратов привел пример со сравнительным анализом использования двух медицинских аппаратов, долгое время широко применявшихся: как оказалось, один из них в три раза чаще провоцировал инфаркты с летальным исходом, чем другой.
Опыт бизнес-анализа в ВТБ24
Сергей Анохин, вице-президент и заместитель директора финансового департамента банка ВТБ24, подтвердил важность быстрой обработки огромных массивов информации для банковской сферы, и одна из самых актуальных сфер для применения новой бизнес-аналитики — повышение качества обслуживания клиентов. В стратегии развития ВТБ24 предусмотрен переход от продуктовой модели бизнеса к клиентской, подразумевающей “дифференцированное и адресное обслуживание клиентов в различных сегментах”. Данная задача, по оценке г-на Анохина, требует выхода на новый уровень обработки информации, поскольку подразумевает ускоренный анализ значительно большего объема данных. К традиционному для продуктового подхода анализу рынка в разрезе продуктов, их основных параметров, к расходам банка по направлениям деятельности добавляется анализ в разрезе рынка по клиентским сегментам, количеству продуктов у клиентов каждого сегмента, доходам и расходам на клиента в разрезе продуктов, сегментов, каналов обслуживания и многое другое.
Количественно оценить объем данных можно исходя из следующих цифр, приведенных докладчиком: в банке сформирован массив годичной информации, агрегированной по месяцам, включающий, в частности, 360 млн. записей в год по доходам и расходам в разрезе клиентов и продуктов, 220 млн. — по клиентским сегментам и 140 млн. — по категориям активности клиентов. На основании этих данных осуществляется анализ поведения клиентов, прогнозируются изменения доходов в плановом периоде, моделируются отклики на различные предложения в разных каналах коммуникаций, оцениваются доходы от новых клиентов, планируются показатели продуктовых портфелей, доходов и расходов для бизнес-плана банка помесячно.
Хотя анализ данных с целью реализации клиентского подхода к бизнесу ведется уже сегодня, решения, которые работают в банке, имеют, по словам Сергея Анохина, серьезные ограничения по временным и ресурсным затратам, а именно: большие ресурсы для расчета статистики (осуществляется ежеквартально с помесячной детализацией); длительные пересчеты в случае изменения моделей или алгоритмов расчета показателей (в том числе недостаточность времени для реализации итерационного подхода по совершенствованию моделей); трудности пользователей при аналитических запросах ввиду значительного объема статистических данных (поскольку работа ведется уже с агрегированной информацией). Именно поэтому новые продукты, анонсированные SAS, потенциально интересны для банка, хотя о каких-то решениях насчет их внедрения, подчеркнул Сергей Анохин, говорить рано.
Новая ступень производительности и наглядности
Андрей Свирщевский, руководитель направлений аналитики и гарантирования доходов “SAS Россия/СНГ”, рассказал о новом продукте SAS High Performance Analytics (HPA), который работает в оперативной памяти блейд-серверов (технология in-memory). В текущей версии продукт обеспечивает новую ступень производительности углубленной аналитики в части поиска в массивах данных закономерностей и построения на их основе прогностических моделей (Data Mining), статистического анализа и прогнозирования временных рядов. В скором времени, отметил представитель SAS, в продукте будут реализованы дополнительные функции: возможность интеллектуального анализа текста (например, живого общения оператора call-центра с клиентом), а также создание оптимальных сценариев развития событий. Решающим фактором повышения производительности, подчеркнул Андрей Свирщевский, стало именно то, что продукт “научился жить в оперативной памяти блейд-серверов”.
Результатом использования продукта являются значительно более точные модели, поскольку, во-первых, анализ осуществляется на всем массиве данных, а не на отдельных выборках, во-вторых, обеспечивается большая детальность анализируемых данных, и, в-третьих, аналитик в процессе оптимизации настроек модели может запустить процесс ее построения большее число раз. Так, согласно данным, приведенным представителем SAS, в одном американском банке до внедрения SAS HPA среднее время построения нейронной сети было 5 ч, после внедрения нового продукта — 3 мин, на построение одной модели у аналитика уходил целый день, после — 30 мин. Во время демонстрации работы системы в режиме онлайн можно было предположить, что продукт не локализован, что и подтвердилось на сессии вопросов и ответов. Более того, как выяснилось, его локализация под русского пользователя пока даже не предполагается. Аргументация проста: бизнес-аналитиков такого уровня немного, а им английская терминология понятна и без перевода. С одной стороны, трудно не признать этот аргумент вполне оправданным, с другой же —можно констатировать, что данный продукт не предназначен для широкого круга бизнес-пользователей.
Алексей Мещеряков, руководитель направления платформенных решений “SAS Россия/СНГ”, представил второй инновационный продукт компании SAS — Visual Analytics, русская локализованная версия которого выйдет в ближайшее время. Ориентирован продукт на гораздо более широкий круг пользователей: помимо математиков-аналитиков, строящих модели, он предназначен для бизнес-менеджеров, отвечающих за исследование показателей и принятие решений, а также бизнес-аналитиков, в чьи функции входит исследование данных и создание отчетов. Решение Visual Analytics, по словам г-на Мещерякова, является инструментом “визуальной разведки данных”, имеющим к тому же высокопроизводительные средства анализа данных. Решение позволяет понять, какие именно массивы информации доступны, и бывает очень полезным, в частности, на предварительной стадии, непосредственно перед проведением углубленного анализа. Продукт, как и его “напарник”, работает со всем массивом информации, а не с выборками данных, без специализированных витрин данных и запросов с привлечением ИТ-специалистов. Инструмент позволяет “в секунду” строить графики, диаграммы, в наглядном виде представляя данные, благодаря чему можно оперативно уловить основные тенденции и закономерности.
Немаловажной является и возможность поделиться результатами своих исследований и своими комментариями с коллегами не только в пределах организации, но и с теми, кто работает в удаленном режиме с помощью мобильных устройств (так, выпущено специальное приложение под SAS Visual Analytics для iPad).
Оба представленных продукта — High Performance Analytics и Visual Analytics, образующие вместе блок SAS In-Memory Analytics, — стали третьей и завершающей частью линейки аналитических продуктов компании SAS High-Performance Analytics, охватывающей теперь, как уверяют представители разработчика, все типы задач, решаемых в бизнес-аналитике (первые две части — SAS Grid Computing и SAS In-Database).
О позиционировании новых продуктов на российском рынке
“Большие данные”, как отметил в своем выступлении Валерий Панкратов, — понятие в общем случае условное, по сути обозначающее ситуацию, когда ПО компании становится не способно эффективно загружать, хранить, обрабатывать и анализировать информацию (с точки зрения именно возможностей софта, а не “железа”, уточнил он). Что касается непосредственно анонсированных на пресс-конференции новых продуктов SAS High Performance Analytics и Visual Analytics, то генеральный директор “SAS Россия/СНГ” позиционировал их как решения для крупнейших компаний, накопивших большие объемы информации за длительное время и имеющих в своем распоряжении высококвалифицированных специалистов — аналитиков, экспертов. В России, резюмировал он, на данном этапе развития рынков и компаний потенциально наиболее готовыми к внедрению инновационных продуктов являются телекоммуникационные компании и банки.