Переход к распределенной инфраструктуре облачных вычислений устранит ограничения сегодняшней архитектуры и откроет возможности для применения новых технологий, пишет на портале Network Computing Роберт Блюмоф, технический директор компании Akamai Technologies.

В недалеком будущем повседневная жизнь миллионов людей изменится — она останется привычной, но при этом преобразится. Все это будет зависеть от революции в облачных вычислениях.

Представьте себе новое поколение продуктов для пространственных вычислений, которые не требуют вмешательства (например, Apple Vision Pro, уменьшенный до форм-фактора обычных очков) и помогают вам ориентироваться в физическом мире таким образом, чтобы соединить вас с окружающим миром, а не изолировать от него. Представьте себе новых агентов искусственного интеллекта, которые действительно работают на вас, беря на себя решение рутинных задач, чтобы вы могли сосредоточиться на творчестве и общении с реальным миром. Представьте, что ваш автомобиль взаимодействует с «умной» городской инфраструктурой, чтобы упростить вашу поездку и сделать ее более безопасной. Будущее не просто наступает — мы мчимся к нему.

Чтобы внедрить эти технологии в масштабах, близких к масштабам смартфона или ноутбука, необходимо кардинально изменить базовую инфраструктуру облачных вычислений.

Эволюция облачных вычислений продолжается

В первые дни существования Интернета весь трафик обрабатывался централизованными серверами. Масштабирование веб-сайта означало покупку все новых и новых серверов. Первая эпоха Интернета закончилась с переходом от монолитной модели к модели, использующей менее дорогие, распределенные серверы и ПО для оптимизации веб-трафика. Вместо вертикального масштабирования в одной центральной точке мы теперь могли масштабироваться горизонтально гораздо более экономичным способом. Веб рухнул бы под собственным весом, если бы не этот отход от централизованных серверов. Децентрализация и распределение контента сделали Интернет работоспособным.

Мы находимся в похожей переломной точке, быстро приближаясь к миру, где централизованные вычислительные ресурсы больше не смогут поддерживать потребности наших технологий. Многие из этих изменений уже происходят. К 2025 г. периферийные устройства будут создавать более 90 Зб (90 триллионов гигабайт) данных. Наша нынешняя интернет-инфраструктура пока может поддерживать более 17 млрд. подключенных устройств, используемых сегодня, но сможет ли она поддерживать почти вдвое большее, согласно Statista, количество подключенных устройств в 2030-м?

Кроме того, несмотря на поразительное распространение ИИ, мы лишь только начали использовать его возможности. Данные показывают, что внедрение генеративного ИИ растет более чем в два раза быстрее, чем смартфонов и планшетов. К 2030 г. объем этого рынка достигнет ошеломляющих 140 млрд. долл. — это очень много для больших языковых моделей (LLM). Такие технологические гиганты, как Alphabet, Amazon, Microsoft и др., пообещали потратить в этом году около 200 млрд. долл., в основном на дата-центры, чипы и другое оборудование для создания, обучения и развертывания моделей генеративного ИИ. Но сможет ли эта преимущественно централизованная инфраструктура масштабироваться по мере роста использования ИИ?

Новые приложения нуждаются в обновлении облачных вычислений

Мы не можем ожидать, что централизованная модель дата-центров — та, что была предназначена для первоначального веба и облачных сервисов 2000-х, — выдержит предстоящую непостижимую нагрузку, которая возникнет в связи с одним только ИИ, не говоря уже о пространственных вычислительных устройствах, «умных» автомобилях и даже обычном росте данных. Эти дата-центры могут находиться за сотни или тысячи километров от конечного пользователя или устройства. Такое расстояние, а также более высокие рабочие нагрузки выливаются в увеличение задержек.

Ожидание загрузки веб-сайта в течение секунды или двух при совершении покупок в Интернете — это рецепт разочарования клиента и отказа от корзины, но задержка еще более губительна при взаимодействии в реальном времени, о котором говорилось выше. От пространственных вычислений до автоматизированного взаимодействия с ИИ и управления городским движением — ключом к успеху является взаимодействие между устройствами и людьми в режиме реального времени с низкой задержкой, причем в огромных масштабах.

Как будет выглядеть эта новая вычислительная инфраструктура? Есть несколько вариантов, хотя я считаю, что есть один явный победитель.

  1. Во-первых, потребители могут адаптироваться к громоздким, требовательным к вычислительным ресурсам устройствам, которые обладают достаточной мощностью для самостоятельной работы, вместо подключения к облаку или периферии.
  2. Другой вариант — сидеть и ждать, пока вычислительные мощности станут достаточно компактны, чтобы поместиться в более совершенные устройства.
  3. Третий вариант, который я считаю наиболее реалистичным, — принять распределенное, децентрализованное облако.

Вместо 20 или около того региональных облачных дата-центров, используемых большинством облачных провайдеров сегодня, сотни (а в конечном итоге тысячи) мощных вычислительных точек будут распределены по всему миру, в непосредственной близости от пользователей и их устройств. Вычислительная мощность будет динамически отвечать потребностям конкретных приложений, а вычислительная инфраструктура — CPU и GPU — будет точно соответствовать требованиям рабочей нагрузки. Рабочие нагрузки смогут обмениваться данными с вычислительными точками и обратно с устройствами за миллисекунды, что позволит создавать приложения реального времени, требующие высокого уровня вычислительного интеллекта при сверхмалых задержках.

Новая норма в облачных вычислениях

Эта революция в распределенных вычислениях — не случай «создай продукт, и за ним придут». Ею движут мощные рыночные силы.

Рассмотрим, куда инвестируют мировые технологические компании. Microsoft сосредоточилась на новых, сложных пользовательских возможностях, которые получат преимущества от периферийных вычислений. Google Distributed Cloud (GDC) продвигает свои возможности «повсеместного ИИ», дополняя ими свои модели Gemini. Инфраструктура Roving Edge Infrastructure от Oracle расширяет облачные сервисы до сетевой периферии. Apple Intelligence будет использовать ИИ в таких больших масштабах — на устройствах для некоторых задач и в частном облаке для более сложных вычислений, — что для его нормального функционирования потребуется огромное количество сетевых соединений. А AWS продвигает периферийные сервисы для развертывания API и инструментов за пределами своих дата-центров.

Это признаки того, что мы движемся в правильном направлении. Однако настоящая революция приведет к тому, что мощные, целевые вычисления появятся в гораздо большем количестве точек присутствия, чем сейчас представляют себе технологические компании, которые все еще инвестируют в ограниченно распределенную модель.

Заключительное слово

В конечном итоге высокораспределенные вычисления станут настолько повсеместными, что будут прозрачны для пользователей. Но без перехода к распределенной вычислительной инфраструктуре ограничения сегодняшней архитектуры вскоре станут очевидными — они нарушат нашу цифровую жизнь и ограничат возможности новых технологий.

Основы новой эпохи Интернета уже заложены и могут стать движущей силой захватывающих технических достижений, вплетая пространственные вычисления, ИИ-агентов и интеллектуальную городскую инфраструктуру в нашу повседневную жизнь. Настало время перенести мощные вычисления как можно ближе к вам.