Будущее искусственного интеллекта — за автономными агентами, работающими на основе масштабируемой бессерверной архитектуры, пишет на портале The New Stack Кевин Кокрейн, директор по маркетингу компании Vultr.

За два года революции генеративного ИИ (GenAI) большие языковые модели (LLM), на которых основаны такие инструменты, как ChatGPT и Claude, стали поразительно мощными. Однако, по мнению генерального директора Salesforce Марка Бениоффа, они могут достигнуть своего предела. Он считает, что следующая эволюция — это не просто более интеллектуальные LLM, а автономные агенты ИИ, которые используют LLM для самостоятельного выполнения задач.

О серьезном отношении Бениоффа к агентному ИИ свидетельствует запуск им в прошлом году платформы Agentforce, чтобы предоставить миллионы агентов ИИ клиентам Salesforce. Он не одинок: Джеремайя Оуян, бывший аналитик Forrester, ставший венчурным капиталистом, предсказал, что скоро агентов ИИ будет больше, чем людей, и на одного человека будет приходиться до 100 агентов ИИ. Если этот прогноз хотя бы частично сбудется, это окажет глубокое влияние на будущее электронной коммерции.

Представьте себе мир, в котором агенты ИИ берут на себя обе стороны взаимодействия клиента и продавца. Такие активы, ориентированные на клиента, как веб-сайты и веб-приложения, могут быть полностью заменены — или, по крайней мере, интегрированы — агентами ИИ, персонализированными под клиента. Эти агенты могут взаимодействовать с ИИ-агентами клиентов, автоматизируя цикл продаж с помощью транзакций между агентами.

По данным опроса 1100 руководителей крупных предприятий, проведенного компанией CapGemini, 10% организаций уже используют агентов ИИ, более половины планируют использовать их в следующем году, а 82% — в течение ближайших трех лет. 64% руководителей ожидают, что агентный ИИ повысит качество обслуживания и удовлетворенность клиентов. К 2028 г., по прогнозам Gartner, 33% корпоративных программных приложений будут включать в себя агентный ИИ.

Учитывая эти прогнозы, это лишь вопрос времени, когда клиенты начнут рассчитывать на то, что агенты ИИ будут предоставлять им информацию, необходимую для принятия решения о покупке, вместо того чтобы искать ее самостоятельно.

Необходимая для развертывания агентного ИИ архитектура уже разрабатывается для предприятий, желающих опередить время и интегрировать его в свои веб-приложения. В частности, чтобы облегчить тысячи взаимодействий с клиентами по всему миру, предприятиям потребуется возможность получать ИИ-выводы с низкой задержкой на периферии.

Создание архитектуры для поддержки агентного ИИ на периферии

Разработка архитектуры для поддержки выводов с низкой задержкой на периферии — важнейшее условие для масштабирования операций агентного ИИ, особенно в электронной коммерции, где агенты ИИ должны взаимодействовать с клиентами по всему миру в режиме реального времени. Этот сдвиг к периферии уже происходит: недавнее исследование S&P Global Market Intelligence (проведенное по заказу Vultr) показало, что более 80% из 1000 опрошенных специалистов в области ИИ и ИТ ожидают развития своих ИИ-операций на периферии в ближайший год.

Однако у большинства предприятий нет и никогда не будет инфраструктуры для масштабной поддержки ИИ-выводов на периферии. Графические процессоры и другие специализированные чипы для ИИ непомерно дороги и быстро устаревают, что делает нецелесообразным внутренние инвестиции в эти ресурсы.

Чтобы сделать ИИ в масштабе экономически эффективным, для ИИ-выводов, выполняемых в периферийных средах, требуется другой технологический стек. Для большинства предприятий бессерверный подход к получению ИИ-выводов будет оптимальным как по стоимости, так и по производительности.

Бессерверный подход: оптимальный выбор с точки зрения стоимости и производительности

Чтобы избежать капитальных затрат на приобретение специализированных ИИ-чипов, которые быстро устаревают, бессерверный подход предполагает использование управляемых облачным провайдером ресурсов, чтобы подобрать для каждой рабочей нагрузки ИИ оптимальный вычислительный ресурс. Одним словом, бессерверный подход позволяет предприятию оставить заботы об инфраструктуре облачным провайдерам, которые занимаются этим ежедневно.

Использование бессерверного подхода позволяет предприятиям воспользоваться преимуществами разнообразия имеющихся у облачных провайдеров процессоров — гиперспециализацией вычислительных ИИ-чипов для удовлетворения уникальных требований к вычислениям на каждом этапе жизненного цикла модели ИИ. С точки зрения клиента, бессерверный подход обеспечивает автоматическое управление масштабированием соответствующих ресурсов в зависимости от рабочей нагрузки ИИ и требований к сценарию использования для оптимизации затрат и производительности.

При использовании бессерверного подхода к управлению вычислительными ресурсами и оптимизации затрат следующим шагом будет разработка архитектуры для поддержки потоковой передачи данных с низкой задержкой и контроля управления данными для обеспечения безопасности данных клиентов.

Сохранение суверенитета и конфиденциальности данных при получении выводов агентного ИИ в реальном времени

Чтобы выйти за рамки общих приложений ИИ, таких как ChatGPT, приложениям агентского ИИ необходим доступ к конфиденциальным проприетарным данным. Это особенно актуально в контексте электронной коммерции, где данные о клиентах необходимы агентам ИИ для предоставления клиентам контекстно-значимой информации. Разумеется, когда модели ИИ обращаются к проприетарным данным, предприятие должно соблюдать местные требования к регулированию данных.

Векторные хранилища и генерация с расширенной выборкой (RAG) — эффективные стратегии, позволяющие поддерживать контроль над данными, чтобы агенты ИИ могли делать выводы, где бы эти данные ни находились. При таком подходе конфиденциальные данные хранятся в векторных хранилищах, защищенных локальными средствами управления данными, к которым агенты ИИ обращаются по мере необходимости с помощью RAG, а не напрямую обучают модели на конфиденциальных данных.

Векторные хранилища и RAG позволяют получать контекстно-адекватные инсайты, не передавая конфиденциальные данные стороннему поставщику модели. Содержимое векторного хранилища можно пополнять без переобучения всей модели, что снижает затраты на обучение. Кроме того, такой подход позволяет легко переносить модели в разные регионы, соблюдая при этом местные требования к суверенитету данных.

Кроме управления данными, предприятиям также необходима потоковая передача данных с низкой задержкой, чтобы обеспечить взаимодействия агентного ИИ в режиме реального времени. Apache Kafka, платформа потоковых данных с открытым исходным кодом, идеально подходит для передачи потоковых данных в реальном времени в приложения агентного ИИ. Благодаря RAG и векторным хранилищам Apache Kafka обеспечивает низкую задержку агентных ИИ-приложений на периферии, сохраняя при этом локальное регулирование.

Агентный ИИ усиливает потребность в правильном архитектурном подходе

По сравнению с традиционным ИИ, агентный ИИ значительно увеличивает нагрузку на инженерные команды, которая связана с настройкой и поддержкой сложной инфраструктуры, необходимой для поддержки роев агентов ИИ, распределенных по обширным географическим территориям и тысячам периферийных устройств. Единственным жизнеспособным подходом является бессерверный ИИ-вывод в сочетании с RAG и управляемой Kafka, который гарантирует, что агенты ИИ будут выполнять свои задачи точно и безопасно, без значимых задержек.

Передав все сложности, связанные с предоставлением, настройкой и автоматическим масштабированием инфраструктуры, облачным провайдерам, инженерные команды могут сосредоточиться на создании надежного слоя приложений ИИ, разработке специализированных агентов ИИ и приоритетном обслуживании клиентов. Бессерверный подход к инфраструктуре ИИ создает идеальную основу для построения нового агентного будущего в работе с клиентами.