Сумма технологий "Терна"

КОНФЕРЕНЦИИ

На своей традиционной, уже шестой ежегодной конференции группа компаний "Терн" (www.tern.ru) представила российской аудитории новую версию платформы бизнес-анализа ее ключевого поставщика - фирмы Business Objects. Презентации BusinessObjects XI был отдан весь второй день этого двухдневного мероприятия. Мы не будем останавливать внимание читателя на достоинствах нового продукта, во-первых, поскольку наш еженедельник недавно уже рассказывал о нем (см. PC Week/RE, N 7/2005, с. 33), а во-вторых, еще и потому, что сообщения о реальных проектах вызвали гораздо больший интерес участников.

Напомним, что в группу "Терн" входят собственно фирма "Терн", дочерние структуры в Праге, Любляне и Перми, а также московская компания "Ксема". В настоящее время группа позиционирует себя как поставщика корпоративных информационно-аналитических систем. И хотя основан "Терн" был еще в 1991 г., его выход на рынок аналитики состоялся в 1997-м, после заключения партнерского соглашения с Business Objects. Два года спустя аналогичное соглашение было подписано с разработчиком средств интеграции корпоративных данных (ETL) DataStage - фирмой Ascential Software, купленной нынешней весной корпорацией IBM. В 2001 г. группа "Терн" создала компанию "Ксема", сосредоточившую свои усилия на технологиях интеллектуального анализа данных (data mining) и автоматизации бюджетирования на основе собственного продукта SHART. Через два года "Ксема" стала партнером франко-американской компании KXEN - разработчика оригинальной технологии моделирования и углубленного анализа данных (впервые российская аудитория ознакомилась с ней на четвертой конференции "Терна", см. PC Week/RE, N 22/2003, с. 29).

Сегодня уже 150 предприятий из стран СНГ и Центральной Европы используют решения, внедренные специалистами "Терна". Как и многие другие отечественные компании, "Терн" не раскрывает финансовые показатели своей деятельности: мне не удалось даже узнать общее число проектов, выполненных за год. По словам ее управляющего директора Николая Мачинского, два последних года обороты компании растут более чем на 50%, причем 70% доходов ей обеспечивают продажи лицензий, а 30% - консалтинг, техническая поддержка и обучение. Такое соотношение объясняется скорее всего тем, что до недавнего времени "Терн" был эксклюзивным дистрибьютором Business Objects в СНГ. Региональные партнеры "Терна" не только получают от него лицензии на ПО, но и участвуют в совместных проектах внедрения информационно-аналитических систем. Называть точное число партнеров г-н Мачинский также не стал, сославшись на то, что почти из сотни компаний, подписавших партнерское соглашение, далеко не все хотя бы раз им воспользовались.

Николай Мачинский:

"В последние два года темпы

роста доходов "Терна" превышают 50%"

Впрочем, в качестве партнеров по внедрению нередко выступают ИТ-подразделения заказчиков, имеющие в своем штате весьма квалифицированных специалистов. Таким был проект в "ВымпелКоме", о котором рассказал его сотрудник Алексей Лазарев. Сотовый оператор федерального масштаба, быстро наращивающий клиентскую базу и осуществляющий региональную экспансию, должен иметь точную информацию о загрузке и эффективности использования своего оборудования - базовых станций, коммутаторов и контроллеров. Подобные сведения собираются разнородными системами, установленными в региональных центрах (сегодня их десять), после чего консолидируются в центральном хранилище данных и учитываются, например, при принятии решений о закупке нового оборудования. Сначала, когда число региональных центров не превышало пяти, хранилище базировалось на СУБД Microsoft SQL Server и загрузка данных в него возлагалась на Microsoft Data Transformation Services (DTS), а также на ряд программ, написанных разработчиками "ВымпелКома" (сами данные извлекались из БД Oracle и Sybase).

Но по мере расширения регионального присутствия объемы собираемых данных ежегодно удваивались и сегодня достигли уровня в 14 млн. записей в день (3 Гб). СУБД Microsoft с подобной нагрузкой справлялась с трудом, а потому было принято решение о переходе на платформу IBM iSeries (AS/400) и DB2. Для загрузки данных в хранилище стали использовать Ascential DataStage, а для их аналитической обработки и генерации отчетов - BusinessObjects. Всего система автоматически выпускает 200 видов отчетов, тридцать из которых с помощью сервера доставки Broadcast Agent выкладываются на внутренний Web-сервер. В настоящее время с системой работают 40 пользователей из 12 подразделений "ВымпелКома", но со временем заказчик планирует перейти на схему лицензирования по числу процессоров и снять ограничение на число пользователей.

Особый интерес аудитории всегда вызывают технологии интеллектуального анализа данных, поскольку, по общему мнению, они обладают магической способностью находить скрытые закономерности в массивах данных, на основе которых можно строить системы оценки кредитного риска для банков, прогнозирования спроса для торговых предприятий или анализа причин оттока клиентов для операторов связи. Если инструменты OLAP-анализа используются тогда, когда модель, т. е. наличие исследуемой зависимости, уже известна (к примеру, предполагается, что объемы продаж зависят от географического расположения торговых точек), то средства data mining, к каким относится и представленный на конференции продукт KXEN, строят эту модель самостоятельно.

Главным достоинством KXEN, по мнению специалистов "Ксемы", является простота и наглядность процедуры построения таких моделей. Так, для формирования скоринговой модели на вход системы подается реальный набор данных, где сведения о возврате клиентами кредитов уже точно известны. На основе этого набора система автоматически строит модель, которую можно использовать при оценке кредитоспособности новых клиентов банка. Конечному пользователю не нужно быть специалистом в области статистического анализа и заниматься подготовкой данных или подбором методики: наряду с моделью он получает две ее характеристики - точность прогноза и устойчивость (т. е. способность описывать не только "обучающий" набор данных, но и любой другой). Более того, KXEN умеет ранжировать факторы по уровню их значимости для прогноза, к примеру, склонности клиента к невозврату взятого займа. Это обстоятельство особенно важно, поскольку последующая работа с ограниченным набором наиболее существенных факторов ускоряет рассмотрение заявок на кредиты и упрощает процедуры предварительного анкетирования клиентов.

Михаил Аветисов убежден,

что технологии KXEN найдут применение

и в традиционном OLAP-анализе

О двух проектах по использованию технологий KXEN в скоринговых системах банка "Русский стандарт" и Лефко-Банка рассказала консультант по маркетинговым проектам "Ксемы" Надежда Дубинина. По ее словам, построение модели обычно занимает две-три недели, но при этом возможны два варианта использования продукта KXEN. Дело в том, что модель представляет собой сгенерированный KXEN фрагмент программного кода на одном из популярных алгоритмических языков или на SQL, который затем может быть встроен в любое приложение или БД. Это означает, что если организация строит модели эпизодически, она может не покупать ПО KXEN, а заказывать "Ксеме" услуги по подготовке моделей на основе своих наборов данных. Учитывая немалую цену продукта KXEN (по словам г-на Мачинского, стоимость минимальной конфигурации для двухпроцессорного сервера превышает 100 тыс. долл.), покупка моделей может оказаться полезной и для предварительной оценки целесообразности приобретения всего этого инструментария. В частности, в "Русском стандарте" пока ограничились покупкой моделей, построенных "Ксемой".

Одна из существенных проблем, на которую обратила внимание г-жа Дубинина, возникает на этапе формирования требований к создаваемой модели. Каждое подразделение заказчика руководствуется собственным набором приоритетов: менеджеры департамента кредитования банка хотели бы снизить трудоемкость и время оценки кредитоспособности клиента, отдел скоринга ставит во главу угла минимизацию невозвратов кредита, а "ИТ-шники" думают об эффективности использования вверенных им ресурсов. Поскольку все эти требования нередко противоречат друг другу, следует ожидать, что модель придется не раз корректировать и уточнять, а потому приобретение системы KXEN, а не просто созданных ею моделей, в такой ситуации может оказаться в конечном итоге более целесообразным.

Способность KXEN выделять наиболее значимые для той или иной целевой переменной факторы с успехом может быть применена в традиционном OLAP-анализе, который существенно усложняется, когда число факторов в анализируемом наборе данных составляет сотни и тысячи единиц. После выделения нескольких значимых факторов пользователь может детально анализировать их влияние на изучаемый показатель. Такой подход реализован в предлагаемом KXEN решении IOLAP (Intelligent OLAP), о котором рассказал заместитель директора "Ксемы" Михаил Аветисов. Здесь мощь технологий KXEN используется лишь частично: аналитик не получает в свое распоряжение прогнозирующую модель, но все-таки заметно уменьшает размерность исследуемой выборки (число столбцов в таблице). Объем выборки можно еще более ограничить (сократить число строк), применив технологию кластеризации KXEN, позволяющую выделить подмножество данных, действительно представляющих интерес в контексте решаемой задачи.

Хотелось бы отметить еще одну область применения подобных технологий, о которой упомянул г-н Аветисов. В любых системах, основанных на сборе и мониторинге ключевых показателей эффективности (KPI), будь то инструменты Business Performance Management или Balanced Scorecards, выбор показателей KPI и оценка их влияния на достижение поставленных стратегических целей нередко осуществляются по наитию, без какого-либо строгого обоснования. Технологии же KXEN обещают не только вывести из рассмотрения малосущественные KPI и упростить тем самым механизмы управления, но и достаточно точно спрогнозировать влияние оставшихся показателей на достижение искомого результата.