Облачные стратегии смещаются от централизованной гравитации данных к гравитации клиентов, когда интеллектуальные технологии разворачиваются на периферии для обеспечения персонализированного взаимодействия в режиме реального времени, пишет на портале InformationWeek Джей Дженкинс, технический директор Akamai по облачным вычислениям.

Годами облачные архитекторы руководствовались концепцией «гравитации данных» — идеей о том, что приложения и рабочие нагрузки естественным образом вращаются вокруг огромных централизованных наборов данных. Это имело смысл в эпоху, когда масштабирование было синонимом централизации. Но сегодня мир изменился. То, как мы создаем приложения, как происходит взаимодействие с пользователями и где возникает ценность, больше не определяется только хранением данных. Мы вступаем в эпоху, определяемую новой силой: гравитацией клиентов (customer gravity).

Самые эффективные облачные стратегии сегодня — это не перенос вычислений к огромным статичным озерам данных. Они направлены на развертывание интеллектуальных технологий там, где происходит взаимодействие — рядом с пользователями, на периферии. Выводы ИИ на периферии, персонализация в реальном времени и время отклика менее 100 мс — это уже не нишевые амбиции, а стандартные ожидания для современных приложений.

Однако наши инфраструктурные привычки не поспевают за развитием событий.

Возьмем, к примеру, зоны доступности (AZ). Они произвели революцию во времена, когда единственным ключевым показателем эффективности было время безотказной работы. Но современные нативно-облачные приложения разработаны так, чтобы устойчиво работать с отказами, автоматически реплицировать данные и оперативно распределять нагрузку. Нативно-периферийные (edge-native) платформы теперь предоставляют встроенные функции автоматического масштабирования и отказоустойчивости в десятках, а то и сотнях локаций по всему миру. Таким образом, ограничивая рабочие нагрузки несколькими плотно сгруппированными AZ, мы не сохраняем устойчивость, а ограничиваем охват.

Например, представьте себе международную компанию электронной коммерции, проводящую ограниченную по времени флэш-распродажу. При традиционной схеме каждый запрос клиента может проходить через центральный регион, что приводит к ненужным задержкам и нагрузке на основные системы. Но благодаря развертыванию на периферии такие функции, как проверка запасов, защита от мошенничества и персонализация цен, могут выполняться рядом с пользователем, где бы он ни находился, обеспечивая более быстрый и надежный процесс оформления заказа.

Точек на карте становится больше, но связи между ними пока недостаточно динамичны, и это проблема. Когда периферийная локация в одном регионе обрабатывает запрос на ИИ-вывод от пользователя из другого региона, возникает задержка, которая ухудшает пользовательский опыт. Статическая маршрутизация и ручной выбор регионов игнорируют тот факт, что цифровое взаимодействие теперь безгранично. Нам нужна инфраструктура, которая адаптируется в режиме реального времени к маршрутизации рабочих нагрузок, а не только трафика, на основе близости, производительности и пользовательского контекста.

Это изменение также меняет подход разработчиков к развертыванию. Вместо того, чтобы управлять сложностью регионов или зон, они могут полагаться на инфраструктуру, которая всё больше работает в фоновом режиме, автоматически выполняя приложения в оптимальных местах в зависимости от потребностей и контекста пользователя в режиме реального времени.

Некоторые периферийные платформы уже движутся в этом направлении, предлагая модели ИИ, которые контейнеризированы, развёртываются на периферии и активируются в зависимости от географического положения, типа устройства или спроса. Почувствуйте разницу между доставкой кэшированного видеопотока (решённая проблема) и генерацией рекомендаций по продуктам в режиме реального времени или обнаружением мошенничества. Последнее зависит от вывода с низкой задержкой, который работает только при локальных и адаптивных вычислениях.

Гравитация данных привела нас к нынешнему состоянию. Но гравитация клиентов требует новых архитектурных моделей, которые отдают приоритет распределенности, учёту контекста и выполнению задач в режиме реального времени. Успеха добьются те компании, которые используют инфраструктуру как адаптивную систему — минимизирующую задержку, максимизирующую релевантность и динамически согласующую вычисления с поведением пользователей. Речь идёт не просто о децентрализации ради неё самой, а о разработке архитектуры для достижения результатов — персонализации, отзывчивости и устойчивости.

Смысл централизации заключался в сборе и защите активов. Смысл распределенности — в их активации в движении. В эпоху ИИ производительность определяется не только мощностью, но и уровнем близости, адаптивности и пользовательского опыта.