Отраслевая структура российского бизнеса компании SAS существенных изменений за прошедший год не претерпела. Об этом свидетельствует, в частности, и очередная ежегодная конференция SAS Forum Russia 2011, прошедшая в середине октября в Москве. На ней, в отличие от предыдущих аналогичных мероприятий, не делалось загадочных прогнозов о предстоящем прорыве в нефтегазовой отрасли или в госсекторе. Не было, впрочем, и объяснений того, почему подобные прогнозы так и не сбылись.
Вполне вероятно, дело в том, что прогнозы делались другими людьми: с недавнего времени генеральным директором SAS CIS является Валерий Панкратов, сменивший на этом посту Валерия Храброва. По словам г-на Панкратова, по-прежнему львиную долю дохода компании приносят банки и телекоммуникационные компании, но определенные перспективы есть также в страховой отрасли. Ожидается, что рост оборота в 2011 г. составит “десятки процентов”, а среди наиболее крупных контрактов нынешнего года руководитель SAS CIS отметил проекты по контролю расходов на основе Activity Based Management в банке ВТБ и управлению операционными рисками в Сбербанке, Газпромбанке и Альфа-Банке. Планируется расширить консалтинговую практику SAS CIS, которая прежде была в основном сконцентрирована в партнерских компаниях. Ключевым заказчикам будет предложена опция премиум-поддержки. Для решения указанных задач представительство SAS в СНГ планируется расширить.
Нынешняя отраслевая структура нашла отражение и в тематике секционных заседаний. Две секции (“Управление рисками” и “Клиентская аналитика”) занимались вопросами, актуальными прежде всего для банков и телекомов, еще одна (“Управление эффективностью организации”) интересна всем заказчикам. Отдельный трек был посвящен технологиям SAS. Представляя очередную версию платформы SAS 9.3, директор глобальной технологической практики SAS Марк Торр обратил внимание на развитие в ней технологий высокопроизводительной аналитики по трем направлениям: кластерные grid-системы, перенос некоторых функций аналитической обработки в ядро СУБД и анализ всего набора данных в оперативной памяти (in-memory). И если первые две уже присутствовали в портфеле SAS, то последняя технология анонсирована впервые. Марк Торр пообещал, что она будет реализована в специализированных программно-аппаратных комплексах и поможет ускорить исполнение алгоритмов data mining и управления рисками. Правда, ничего не было сказано о самой аппаратной платформе и вендорах, которые готовы ее выпускать. Еще один заметный тренд — рост спроса на средства анализа огромных объемов неструктурированной информации (так называемые инструменты Big Data).
Впрочем, в России они пока не нашли широкого применения. Гораздо более активно в рамках панельной дискуссии обсуждалась проблема, которую я бы по аналогии назвал Bad Data. Внимание на нее обратил председатель правления банка “Тинькофф кредитные системы” Георгий Чесаков. В его учреждении для построения модели поведенческого скоринга сначала проводится серия экспериментов на ограниченной группе клиентов, которым, к примеру, временно повышают кредитные лимиты. Затем на основе этих экспериментов средствами SAS строится та или иная модель, используемая впоследствии по отношению ко всей клиентской базе банка. Оказалось, что на эффективность модели значительно более сильное влияние оказывает не ее алгоритмическая изощренность, а качество используемых исходных данных. И речь здесь идет не только о единстве метаданных или об очистке информации, но и о вовлечении в оборот более широкого спектра источников данных. Расширение этого спектра позволяет учитывать большее число важных параметров.
С аналогичной проблемой сталкиваются и коллекторские агентства, которым бывает необходимо проанализировать информацию о должниках и выявить среди них тех, которые потенциально способны вернуть кредит. Как рассказал заместитель генерального директора компании “Секвойя кредит консолидейшн” Алексей Козырев, им для решения данной задачи крайне полезны были бы данные кредитных бюро и личная информация о клиентах, но хранить ее такие агентства не имеют права согласно законодательству. Еще одна причина низкого качества анализируемых данных — разнобой в форматах и структурах данных, предоставляемых банками его организации.
Директор департамента по развитию продуктов и услуг МТС Павел Ройтберг, напротив, заявил, что у мобильного оператора информации накапливается очень много, а основная проблема, которую приходится решать, — это интеграция данных из разнородных источников. Совершенно очевидно, что и в этом случае речь в конечном итоге идет о качестве анализируемой информации.
Довольно неожиданное развитие получило обсуждение вопроса полноты, адекватности и качества предлагаемых на рынке аналитических инструментов. “Они есть и вполне конкурентоспособны, — констатировал Георгий Чесаков. — Проблема в том, найдутся ли люди, способные их эффективно применять и достигать реальных результатов”. По-видимому, кадровый дефицит в такой сложной области, как углубленная бизнес-аналитика, проявляется особенно остро.