Несмотря на воскресный день, конференция Sberbank In-Memory Computing Day собрала внушительную аудиторию — более 400 человек. Организовал ее Сбербанк с целью обсуждения, в частности, возможностей технологии In-Memory Data Grid (IMDG), ставшей особенно популярной после ее упоминания председателем правления банка Германом Грефом на прошлогоднем Гайдаровском форума. Речь идет о программном продукте GridGain In-Memory Data Fabric американской компании GridGain Systems, в которой трудится немало российских специалистов. В то же время имеется определенный дефицит информации относительно конкретных задач, которые будут решаться в Сбербанке с помощью IMDG.
Первый заместитель председателя правления Сбербанка Максим Полетаев обосновал необходимость создания новой ИТ-платформы банка тем, что бизнес-модели будущего должны основываться на экосистемах, объединяющих самых разных субъектов на одной технологической платформе, которая прозрачным образом позволит им использовать все общие данные. Одним из элементов такой цифровой платформы должна стать так называемая фабрика данных, способная с приемлемой производительностью поддерживать работу десятков миллионов пользователей, управлять петабайтными объемами данных и проводить десятки и сотни тысяч транзакций в секунду. Как утверждает Максим Полетаев, детальный анализ всех предложений на рынке показал, что ни у одного из грандов мирового ИТ-рынка нет технологий, способных решать подобные задачи, и именно поэтому выбор был остановлен на продукте компании GridGain.
Говоря о тех направлениях, которые Сбербанк развивает в приоритетном порядке, докладчик особо выделил искусственный интеллект. Уже сегодня в банке развернута система, которая осуществляет мониторинг повседневной работы сотрудников, анализирует ее и выдает рекомендации по оптимизации трудозатрат. В рамках проекта «Железная леди» создан чат-бот — виртуальная дама, которая на естественном языке общается с потенциальными заемщиками, при этом она не просто информирует клиентов, но и оценивает риски выдачи кредитов. Работы в направлении Интернета вещей находятся на начальном этапе. Рассматриваются варианты применения технологии IoT для анализа работы кассовых аппаратов и автотранспорта, задействованного в операциях банка.
Старший вице-президент блока «Технологии» Сбербанка Никита Волков обратил внимание на такое важное для платформы будущего качество, как наличие открытых API-интерфейсов, позволяющих подключать к ней всех участников экосистемы, включая партнеров и сторонних разработчиков. Не менее важны надежность и скорость работы банковских сервисов в условиях, когда ИТ-платформа горизонтально масштабируется в широких пределах. Особо жесткие требования накладывает размещение всех критически важных данных в оперативной памяти кластера, все узлы которого имеют равноправный доступ к общему массиву ОЗУ.
Как рассказал старший управляющий директор блока «Технологии» Сбербанка Михаил Хасин, надежность такой in-memory системы обеспечивается четырехкратным резервированием: одни и те же данные реплицируются в ОЗУ нескольких узлов кластера. Кроме того, периодически все данные из ОЗУ сохраняются на дисках.
В настоящее время в Сбербанке в пилотном режиме под управлением In-Memory Data Fabric эксплуатируется кластер из 136 серверов, до конца года его планируется ввести в промышленную эксплуатацию. Еще более амбициозные планы на 2018 г., когда размер кластера будет доведен до 2 тыс. узлов, а суммарный объем его оперативной памяти составит 1500 Тб. По словам Никиты Волкова, в нем будет находиться вся информация о клиентской базе, оперативный доступ к которой будут получать все приложения и системы Сбербанка.
GridGain заявляла, что их система обладает горизонтальной линейной масштабируемостью в самых широких пределах. Михаил Хасин сообщил, что в Сбербанке экспериментально подтверждена линейная масштабируемость до 500 узлов, а проверка конфигурации из 2 тыс. серверов состоится в следующем году. Впрочем, у архитектора решений компании GridGain Артема Шитова есть сведения о том, что участники проекта Apache Ignite, развивающие исходный код In-Memory Data Fabric, переданный сообществу Open Source, подтвердили линейную масштабируемость кластерных конфигураций из тысяч узлов.
Из его слов стало ясно, что за прошедшие с первой нашей публикации два года продукт компании GridGain претерпел существенные изменения. Тогда CTO GridGain Никита Иванов отмечал: «Наше ПО логически и архитектурно находится в слое над БД и под приложением. Цель здесь — обеспечить более высокую производительность и масштабируемость приложений в сравнении с системами, основанными на дисковом хранении данных». Сегодня, по словам Артема Шитова, продукт из in-memory data grid превратился в memory-centric СУБД с массовым параллелизмом, поддерживающую язык SQL, структуры ключ-значение, гибридные конфигурации с размещением данных как в оперативной памяти, так и на диске.