Открывая центр компетенций (ЦК) по Grid-технологиям компании «Инфосистемы Джет», его руководитель Дмитрий Сергеев выразил надежду, что в следующем году это позволит интегратору контролировать 20% российского сегмента данного рынка. Согласно оценкам «Инфосистем Джет», сам этот рынок пока не очень велик: в нынешнем году он составит 9,8 млн. долл., а в следующем — 11,5 млн. долл. Судя по всему, львиную долю дохода в этом сегменте компании обеспечит двухлетний контракт стоимостью около 200 млн. руб. на разработку системы процессинга для новой ИТ-платформы Сбербанка, реализующей концепцию распределенных вычислений на базе продукта GridGain.
Сославшись на Gartner, Дмитрий Сергеев подчеркнул, что направление Grid растет в мире в целом на 20% в год (в 2016 г. его объем составит 700 млн. долл.). Впрочем, тут возникает вопрос: одинаково ли трактуют понятие Grid «Инфосистемы Джет» и Gartner? По мнению Дмитрия Сергеева, в самых общих словах Grid-технологию можно характеризовать как форму логического объединения распределенной инфраструктуры. Этому определению отвечают, в частности, линейно масштабируемые кластерные инфраструктуры на основе commodity-серверов стандартной архитектуры, применяемые как для хранения данных, так и для их вычислительной обработки. В том числе и используемые в технологии Big Data распределенные хранилища Hadoop. Однако в исследовании Gartner под названием Market Guide for In-Memory Data Grids, на которое сослался Дмитрий Сергеев, инструменты, связанные с Hadoop, не упоминаются, а акцент делается на средства распределенной обработки больших массивов данных в оперативной памяти кластера. Не удивительно, что перечни продуктов, находящихся в фокусе внимания «Инфосистем Джет» и упомянутых в отчете Gartner, не совпадают. И там, и там присутствуют GridGain, Hazelcast и Oracle Coherence, но «Инфосистемы Джет» планируют использовать в своей работе также Hadoop HDFS, Spark, Cassandra, Hive и ряд других продуктов. Обращает на себя внимание, что в обоих перечнях отсутствует платформа SAP HANA. Да и о некогда шумно пропагандировавшейся кластерной СУБД Oracle Grid сегодня мало кто вспоминает.
По мнению менеджера по развитию центра программных решений компании «Инфосистемы Джет» Дмитрия Мельникова, применение Grid-технологий оправдано в тех случаях, когда отдельный сервер перестает справляться с нагрузкой, все возможности оптимизации его производительности исчерпаны, а переход на более мощное high-end «железо» экономически не целесообразен. Типичные пороговые параметры: объем данных больше 1 Тб, требуемая интенсивность обработки — более тысячи транзакций в секунду, а допустимая задержка — менее 10 с. Наряду с очевидными техническими и экономическими достоинствами Grid-архитектур, у них есть и существенные недостатки: отсутствуют готовые коробочные решения, распределенные системы трудно поддерживать, а соответствующих специалистов на рынке сегодня мало. Решение указанных задач, в том числе и посредством создания типовых конфигураций, — одно из важных направлений деятельности созданного ЦК. К другим направлением можно отнести обоснование экономической целесообразности, помощь заказчику в формировании его ИТ-стратегии, предоставление решений под ключ, включающих полную техническую поддержку.
В конце лета в рамках проекта со Сбербанком в центре компетенции была построена пилотная OLTP-система на базе GridGain, подтвердившая линейную масштабируемость кластера из семи серверов с нагрузкой 20 тыс. транзакций в секунду. Тем не менее, предстоит еще большая работа, поскольку в Grid-кластере Сбербанка предполагается использовать тысячи серверов. Три разработчика ЦК уже прошли стажировку в компании GridGain. Запущены еще несколько проектов меньшего масштаба. Один из них — построение корпоративной версии распределенного хранилища на базе продукта Reverbrain (своеобразный аналог «Яндекс.диска»), другой — тестирование NoSQL-СУБД Tarantool (разработка Mail.ru), третий — построение OLTP-системы с использованием решения фирмы GridGain в банке, название которого пока не раскрывается.
«Как интегратор, мы видим сильно возросший интерес к Grid-решениям со стороны крупных игроков различных секторов экономики — это, прежде всего, банки, ритейлеры, страховые компании, телеком-операторы. В этом году количество поступивших к нам запросов на такие системы увеличилось по сравнению с
Наряду с собственно Grid-технологиями, на базе ЦК планируется, опираясь на распределенную обработку, развивать и смежные направления, такие как машинное обучение, прогнозная аналитика и BI, Big Data, OLTP. Здесь большое значение имеет принципиальная возможность распараллеливания соответствующих задач. Как подчеркнул менеджер по развитию центра программных решений компании «Инфосистемы Джет» Евгений Колесников, на данном этапе приоритет будет отдаваться аналитическим задачам, допускающим подобное распараллеливание.