Нил Уорд-Даттон, вице-президент IDC Europe по искусственному интеллекту, автоматизации, данным и аналитике, рассказывает в корпоративном блоге, почему одна модель больше не подходит для всех сценариев и как руководители могут сориентироваться в следующей волне архитектуры ИИ.

С момента появления ChatGPT в конце 2022 г. доминирующей тенденцией в области ИИ было представление о том, что крупные универсальные «базовые модели» могут использоваться во многих сценариях: от написания программного кода до создания маркетинговых планов, подведения итогов встреч, анализа контрактов и многого другого.

Но по мере приближения 2026 г. ситуация меняется, и становится очевидным, что для оптимального обслуживания целевых бизнес-сценариев лучше всего, когда модели ИИ хотя бы в некоторой степени специализированы. Более того, даже поставщики самых современных моделей ИИ на самом деле поставляют свои продукты и услуги в виде «смесей экспертов» (MoE): наборов моделей, предназначенных для выполнения определенных задач, скрытых за единым интерфейсом, где каждый запрос (промпт) направляется к наиболее подходящей специализированной модели.

Согласно отчету IDC «2026 AI and Automation FutureScape», к 2028 г. 70% ведущих предприятий, встраивающих ИИ в свой бизнес, будут использовать передовые многофункциональные архитектуры для динамического и автономного управления маршрутизацией между различными моделями.

Сдвиг: от выбора модели к оркестрации моделей

До появления генеративного ИИ (GenAI) выбор оптимальной архитектуры модели ИИ был ключевым шагом на пути к успеху в достижении эффективных результатов. Даже сейчас при внедрении GenAI многие команды тратят значительное время на поиск «лучшей модели» для конкретного сценария использования. Команды изучают тесты моделей, проводят испытания, сравнивают результаты, выбирают победителя и оптимизируют его.

Однако в настоящее время мы наблюдаем взрывной рост инноваций и технических достижений в области моделей ИИ, и то, что сегодня может быть «лучшим», через шесть месяцев (или даже через месяц) может оказаться далеко не лучшим. Более того, агентные системы ИИ требуют гибкости. Различные задачи, которые должны выполнять агенты, скорее всего, потребуют разных видов возможностей.

Маршрутизация моделей позволяет командам создавать системы, которые оценивают поступающие запросы и автоматически направляют их к модели, наиболее подходящей для данной задачи, или даже комбинируют модели последовательно для получения оптимального результата.

Почему это важно: производительность, стоимость и доверие

Ценность маршрутизации моделей заключается не только в защите от технологической энтропии, но и в оптимизации производительности, стоимости и доверия.

  • Производительность: маршрутизация моделей позволяет повысить точность и надежность систем за счет динамического выбора модели, наиболее подходящей для конкретного контекста, вместо того, чтобы заставлять общую модель обрабатывать каждый запрос. Кроме того, модели могут выбираться в зависимости от места их работы — например, на периферии, в локальной инфраструктуре, в публичном облаке — с учетом влияния задержки и стоимости.
  • Контроль затрат: с помощью маршрутизации рабочие нагрузки можно разумно распределять между премиальными проприетарными моделями, где это необходимо, и эффективными Open Source-альтернативами.
  • Управление и доверие: предприятия могут обеспечить соблюдение нормативных требований и суверенитет, гарантируя, что определенные типы данных всегда обрабатываются утвержденными, специфическими для региона или частными моделями.

Что следует делать руководителям

Что все это означает для руководителей, пытающихся внедрить маршрутизацию моделей на практике? Начните с изменения мышления, усиления контроля и проектирования с учетом гибкости с самого первого дня.

  • Примите мультимодельное мышление. Перестаньте оптимизировать одну модель и начните проектировать архитектуры, которые могут размещать и коммутировать несколько моделей.
  • Инвестируйте в управление и наблюдаемость ИИ. Маршрутизация моделей вводит еще один технологический уровень, и вам понадобятся системы мониторинга, которые отслеживают производительность, качество и затраты системы по каждому маршруту и в течение времени.
  • Изучите сочетание открытых и проприетарных моделей. Современные проприетарные модели могут давать отличные результаты, но при этом отличаться высокой стоимостью и низкой гибкостью. Открытые модели, которые гораздо проще специализировать и которые предлагают гибкость развертывания, могут очень хорошо подходить для отдельных сценариев использования.

Точка зрения IDC: маршрутизация — путь к масштабированию

Для предприятий обеспечение ценности ИИ в масштабе заключается в использовании различных рычагов для оптимизации результатов, а не в использовании все более крупных моделей. Маршрутизация моделей — один из основных рычагов, который будет приобретать все большее значение.

Поскольку предприятия сталкиваются с противоречивыми требованиями в отношении суверенитета данных, вычислительных затрат и разнообразия моделей, архитектуры маршрутизации являются ключевым инструментом для преодоления сложности. Маршрутизация моделей помогает организациям рассматривать автоматизацию на базе ИИ как распределенную, скоординированную функцию, а не как монолитную. Те, кто освоит маршрутизацию, будут двигаться быстрее, тратить меньше и внедрять инновации более безопасно. Те, кто этого не сделает, будут наблюдать, как их стратегии, основанные на одной модели, заходят в тупик под тяжестью собственных ограничений.

К 2028 г. 70% ведущих предприятий, встраивающих ИИ в свой бизнес, будут использовать передовые многофункциональные архитектуры для динамического и автономного управления маршрутизацией между различными моделями, оркестрируя сложные процессы.