Возможность создавать агентов искусственного интеллекта с использованием небольшого количества инструментов программирования или вообще без них, а также комбинирование модальностей ИИ, должны быть в фокусе внимания ИИ-инженеров, рассказал порталу The New Stack Саймон Марголис, помощник технического директора по ИИ и MО компании SADA, вендора сервисов Google Cloud.

За последние 20 лет инноваций мы достигли ряда переломных моментов, когда были созданы совершенно новые классы профессий. Вспомните о росте популярности облачных архитекторов и разработчиков после запуска AWS в 2006 г., мобильных разработчиков с появлением iPhone и Android, инженеров по МО, когда у нас наконец-то появилось достаточно данных и вычислительных мощностей для обеспечения работы нейронных сетей, а затем специалистов в области науки о данных, когда эти первые три тенденции слились воедино.

Следуя по этому пути эволюции, мы, возможно, достигли еще одной точки перегиба: появления инженера по ИИ. В последние пару лет в моду вошел ИИ-инжиниринг, который находится на переднем крае использования больших языковых моделей (LLM) и связанных с ними инструментов для создания ИИ-чатботов, агентов и других ИИ-возможностей.

По мере развития базовых моделей и ИИ-инжиниринга некоторые тенденции начинают усиливаться. Но их воздействие, по словам Марголиса, сильно зависит о того, на каком уровне зрелости в области ИИ находится человек. «Это зависит от того, на каком этапе общей кривой внедрения генеративного ИИ вы находитесь, — говорит он. — Есть люди, которые все еще „не парятся“, и есть люди, которые занимались разработкой ИИ задолго до того, как ChatGPT стал чем-то вроде имени нарицательного. Я думаю, что местонахождение людей в этом спектре во многом определяет, каковы их основные тенденции».

В целом, Марголис выделяет три ключевые тенденции для ИИ-инженеров: 1) возможность создавать ИИ-агенты с помощью low- или no-code и без технических знаний; 2) комбинирование модальностей ИИ, таких как МО и генеративный ИИ; 3) использование генеративного ИИ для создания агентов генеративного ИИ.

Создание ИИ-агентов без кодирования

Две ведущие платформы генеративного ИИ, Google Cloud и OpenAI, поработали над тем, чтобы ИИ-инженерам было проще создавать ИИ-агенты, не прибегая к излишней работе с базовыми моделями или векторными базами данных. Обе компании представили инструменты для создания агентов: Vertex AI Agent Builder и GPT соответственно.

«Что касается раннего внедрения, то одна из самых важных вещей, которую мы наблюдаем в последнее время, — это возможность создавать генеративные агенты, не прибегая к глубоким техническим ухищрениям, — говорит Марголис. — Тогда как, возможно, два года назад вам нужно было по-настоящему разбираться в таких вещах, как трансформеры и RAG (генерация с расширенным поиском), и требовалось много глубокой технической работы».

Он отмечает, что, хотя существуют некоторые второстепенные игроки в области создания агентов, в реальности он в основном видит применение только Agent Builder и GPT. «С такими вещами, как Agent Builder и GPT, вам не нужно быть инженером по ИИ, чтобы делать это, — говорит он. — Вы можете быть непрофессионалом. Вы можете делать это, используя обычный текст, ClickOps или что-то в этом роде. Все становится более предсказуемым с точки зрения пространства решений».

Чистым эффектом от возможности создавать агентов, обладая небольшими техническими знаниями, стало появление (и частично реализация) идеи создания агентов представителями бизнес-подразделений — вместо того, чтобы полагаться исключительно на разработчиков.

«На высоком уровне вы берете информацию из какой-либо системы — частной, Интернета, какой-то их комбинации — и используете ее для информирования ИИ-инструмента, агента или некоего генеративного помощника, — говорит Марголис. — Это та же самая схема, которую мы наблюдали, может быть, год или два назад, с LangChain, когда у вас есть циклы логики и рассуждений, и вы дополняете результат, пока не дойдете до того, что он действительно даст вам то, что вы хотите. Просто стало намного меньше нюансов».

Сочетание ИИ-модальностей

Идея объединения модальностей ИИ может представлять наиболее практический интерес для ИИ-инженеров. Следует отметить, что когда Марголис говорит об ИИ-модальностях, он имеет в виду разницу между тем, что мы могли бы назвать «традиционным» машинным обучением, например, используемым для вывода и прогнозирования, и более новыми модальностями базовых моделей и генеративного ИИ. Это отличается от идеи модальностей в рамках генеративного ИИ, где ввод и вывод зависят от типа данных, таких как текст, аудио, видео или перевод.

«Если раньше вы видели людей, которые действовали либо в мире генеративного ИИ, либо в более традиционном мире MО, связанном с логическими выводами, предсказаниями и тому подобным, то теперь вы начинаете видеть сочетание этих двух миров», — говорит Марголис.

Он отмечает, что именно здесь мы можем увидеть использование генеративного ИИ без необходимости создания специального ИИ-агента или чатбота. Он приводит пример использования инструментов ИИ для представления данных в системе здравоохранения, где у вас может быть несколько полей данных о пациенте, вводимых медсестрами, врачами или администраторами, которые записываются с помощью генеративного инструмента. Затем в рамках той же системы применяются инструменты MО с механизмами логического вывода, которые могут сказать, входит ли этот пациент в группу высокого риска, и т. д.

«Пару лет назад, если бы я захотел создать подобное медицинское приложение, мне, вероятно, потребовалось бы привлечь нескольких моих коллег по MО, которые хорошо разбираются в создании моделей, и им, вероятно, потребовалось бы создать для меня причинную модель с использованием JAX или TensorFlow. Возможно, им пришлось бы в буквальном смысле слова подключаться к физическим графическим процессорам. Для этого потребовалось бы много работы в области MО-инжиниринга и науки о данных. Теперь, воспользовавшись генеративным подходом, возможно, я могу просто взять этот результат и перенести его в контекстное окно моей любимой генеративной модели. Но это два действительно разных набора навыков», — говорит Марголис.

По его словам, преодолеть разрыв между инструментами МО и инструментами генеративного ИИ могут помочь такие инструменты, как Vertex: «Теперь тот же МО-инженер может взять и создать модель AutoML в Vertex. Это не решение no-code, но это решение с относительно небольшим количеством кодирования. Я не создаю модель с нуля. Я не пишу в TensorFlow. Я не пишу в JAX. Я не имею дела с графическими процессорами. Я не имею дела с какими-либо виртуальными или системными компонентами».

Генеративный ИИ помогает создавать генеративный ИИ

Мы еще не дожили до того мира, где компьютеры самостоятельно создают свои собственные дочерние компьютеры и пишут свой собственный код. Однако интересным достижением в области ИИ-инжиниринга является использование генеративного ИИ для создания более эффективных агентов, ботов и приложений генеративного ИИ.

«Я думаю, что это мощная модель, которая позволит многим людям работать в этом пространстве», — говорит Марголис.

Он сравнивает эту тенденцию с переломными моментами последних 10-15 лет, когда разработчики смогли начать легко развертывать виртуальные машины в облаке примерно в 2010 г., или когда примерно в 2014-м был снижен барьер для создания мобильных приложений.

«Мне кажется, что это тот же момент „охренеть!“, что и в случае с публичным облаком, когда мы поняли, что каждый студент, только начинающий изучать информатику или системный дизайн в 2010 г., вдруг может запросто запускать серверы и базы данных, — говорит Марголис. — Если 18 месяцев назад вы хотели стать ИИ-разработчиком, вам предстояло преодолеть большой путь. Чтобы достичь того момента, когда вы действительно сможете реализовать свою идею, требовалось проделать огромную работу. Теперь, если у нас появилась идея, вы, возможно, сможете воплотить ее в жизнь прямо за обедом».

«Барьер для входа действительно снизился, и я думаю, что это хорошо для всех», — считает он.