Дженсен Хуанг говорит, что агенты ИИ — это «многотриллионная возможность». Марк Бениофф считает, что агенты — это «то, чем должен был стать ИИ». А Сатья Наделла считает, что SaaS мертв. На дворе 2025 г., и ИИ-агенты — самая важная тема в ИИ (или так кажется). Технологическая индустрия обожает свои модные словечки, и «агенты ИИ», возможно, самое модное из них, пишет в корпоративном блоге Лесли Джозеф, главный аналитик Forrester.
В то время как некоторые поставщики платформ действительно включают агентные функции в свои дорожные карты, другие просто наживаются на хайпе. Я вижу много путаницы среди компаний-покупателей этих технологий, которые пытаются разобраться во всем этом ажиотаже, чтобы понять, что такое агенты на самом деле, что они значат для бизнеса и каков их выбор.
Агент без самостоятельности — это не агент
Мы все еще находимся на достаточно ранней стадии развития этой технологии, поэтому определения и характеристики могут быть немного изменчивыми, но общепризнанно, что агенты ИИ — это конструкции на основе больших языковых моделей (LLM), которые демонстрируют определенные шаблоны дизайна: планирование, размышление, сотрудничество с другими агентами и использование инструментов. В основе этих паттернов лежат два фундаментальных строительных блока истинных «агентных» возможностей:
- Агентность. Определяющей характеристикой агентной системы ИИ является «агентность» (самостоятельность) — способность контролировать и направлять свой собственный программный поток, принимая независимые решения о конкретных путях, последовательности и характере действий, которые должны быть выполнены для достижения своих целей. Разумеется, агентность может быть узкой или широкой, но ожидается, что агенты ИИ будут обладать широкой самостоятельностью в отношении различных целей в контекстном пространстве.
- Автономность. Это продукт «агентности» агента, а также обобщенного интеллекта современных базовых моделей. Автономность относится к широте контекстов (исключения, внешние факторы и крайние случаи), в которых ИИ может эффективно работать и достигать желаемых результатов, не требуя явных инструкций или вмешательства со стороны человека.
Сразу видно, что самостоятельность и автономность подпитывают друг друга. Вместе эти черты отличают настоящих ИИ-агентов от их менее совершенных аналогов.
Если вы внимательно посмотрите на многие «агентные» решения, предлагаемые SaaS-продуктами, то поймете, что они представляют собой разношерстный набор. Вы быстро поймете, что эти «агенты» имеют или ограниченную автономию, или ограниченные полномочия, или ограничены таким узким контекстным пространством, что вы могли бы с тем же успехом использовать детерминированный рабочий процесс или обычный
Они не являются истинно «агентными». Чаще всего они просто «агентоподобные».
Спектр автономии
Это не значит, что в таких агентоподобных рабочих процессах нет никакой ценности. У них есть свое место в автономной экосистеме, и в ближайшие несколько месяцев их возможности будут становиться все лучше и лучше. Но называть их агентами ИИ все же не стоит.
В этом контексте полезно понимать уровни автономности. Мы в Forrester склонны картировать системы ИИ по спектру самостоятельности и автономии, включающему различные аспекты управления, исполнения и мониторинга. Это аналогично концепции уровней автономии в самоуправляемых автомобилях, но в применении к корпоративным процессам. Давайте выделим основные уровни:
- Уровень 0: ручное управление. Люди, как это ни парадоксально, воплощают в себе наивысшие уровни агентных и обобщенных способностей (или «здравого смысла»). Человеку обычно можно поручить определенную роль, и он не нуждается в подробных инструкциях или пошаговых схемах для выполнения работы. Но смысл автономии заключается в том, чтобы уменьшить зависимость от человеческого труда, поэтому этот уровень является базовым, от которого можно отталкиваться при оценке автономии более высокого уровня.
- Уровень 1: автоматизация, основанная на ПО или правилах. Сюда входит традиционная программная автоматизация, а также ассистенты для выполнения конкретных задач, которые могут быть созданы с помощью традиционных технологий автоматизации, таких как Robotic Process Automation (RPA) или автоматизация рабочих процессов. Эти системы эффективно выполняют заранее определенные задачи по заранее настроенным маршрутам, но не обладают какой-либо значимой способностью принимать решения, выходящей за рамки простых детерминированных логических операций.
- Уровень 2: вероятностная автоматизация. Сюда относятся системы, в которых для повышения уровня автоматизации используется машинное обучение или LLM, но при этом они остаются привязанными к статичным рабочим процессам. Например, в процессе работы с клиентами, подобном RPA, может использоваться модель МО для создания списка клиентов, которые, скорее всего, перестанут быть таковыми. Мы часто слышим, как поставщики утверждают, что их ПО является «агентным», потому что оно может принимать недетерминированные решения... Что ж, большинство моделей МО работают с вероятностями и, следовательно, являются недетерминированными. Это не делает их агентными, так как они не обладают самостоятельностью и нацелены только на выполнение конкретной задачи.
- Уровень 3: операторы ИИ, или оркестровка агентных процессов. Эти квазиагенты имитируют самостоятельность, но действуют в рамках жестко определенных ограничений. Представьте себе
«LLM-обертки» вокруг детерминированных рабочих процессов. Подавляющее большинство современных так называемых «агентов» от SaaS-вендоров относится к этому уровню, как и инструменты, которые Forrester называет «агентной автоматизацией процессов». Они агентоподобные, потому что обеспечивают автономность только в узком контекстном пространстве и имеют очень ограниченные возможности в этих узких контекстных пространствах. В этом контексте важно отметить, что для многих организаций агентоподобные рабочие процессы и гибридная оркестровка на уровнях 2 и 3 — при правильном подходе — окажутся чрезвычайно полезными в ближайшей перспективе, но решающее значение для успеха будут иметь выбор сценариев использования и тонкость технического исполнения. - Уровень 4: агенты ИИ, или «агентные системы». Системы этого уровня демонстрируют как самостоятельность, так и автономность в широком контексте. Как и высококвалифицированным коллегам или менеджерам, им не нужна пошаговая схема; они ориентированы на достижение цели, используя свои знания и контекстную осведомленность для определения наилучшего курса действий. Агенты ИИ имеют высокие показатели по параметрам контроля и исполнения, при этом их возможности мониторинга ограничены.
Уже появилось несколько настоящих агентов ИИ. В качестве примера можно привести Devin, агента программирования, или AI Scientist для исследований и научных открытий. Мы уже видели несколько примеров использования настоящих агентов ИИ на предприятиях в таких областях, как поиск новых лекарств, сложные процессы «узнай своего клиента» или создание расширенных аналитических материалов (и это лишь некоторые из них). При этом истинно агентные системы работают на уровне возможностей, который на ступень выше, чем у агентоподобных систем в плане создаваемой бизнес-ценности. - Уровень 5: AGI (общий искусственный интеллект), или то, что будет дальше. Мы не знаем, как будет развиваться ИИ в ближайшие пять лет. Несмотря на то что AGI пока остается желаемым и плохо определенным, он описывает будущее, в котором системы ИИ станут саморегулируемыми и будут управлять не только целями, но и своим развивающимся предназначением.
Что это значит
Можно представить себе организации, построенные в виде иерархий, в которых агентные системы управляют другими формами автономии на уровнях 1, 2 и 3 (включая агентоподобные системы), либо заменяя, либо дополняя человеческий труд в этих ролях. И в этом нет ничего нереального.
Однако большинство организаций находятся на очень ранних этапах этого пути. Поэтому важно, чтобы покупатели технологий и лица, принимающие решения, смотрели на шумиху ясным взором и понимали, что агентоподобные системы — не земля обетованная для автономности предприятия, а лишь промежуточный (но, тем не менее, важный) шаг на этом пути.