Точно так же, как искусственный интеллект меняет место размещения рабочих нагрузок, он трансформирует и способ построения сетей, вновь выводя на первый план высокопроизводительное оборудование, пишет на портале The New Stack Ли Петерсон, вице-президент по управлению продуктами Secure WAN компании Cisco.

В течение последнего десятилетия сетевые технологии следовали той же траектории, что и большая часть ИТ: абстрагирование интеллекта от отдельных устройств, централизация управления в ПО и рассмотрение базового оборудования как в значительной степени взаимозаменяемого. Программно-определяемые глобальные сети (WAN), программно-определяемые локальные сети (LAN) и централизованные инструменты оркестрации стали нормой.

Во многом этот сдвиг обеспечил предприятиям именно то, что им было нужно: большую гибкость, централизованное управление политиками, автоматизацию в масштабе и упрощение сетевых операций. Скорость предоставления ресурсов и согласованность применения политик на обширных географических территориях изменили подход к работе ИТ-команд.

Но теперь ИИ переписывает эти правила. Требования, которые рабочие нагрузки ИИ предъявляют к сети — в плане масштаба, чувствительности к задержкам, безопасности — больше похожи на требования высокопроизводительных вычислений, чем традиционных бизнес-приложений. Это заставляет вновь обратить пристальное внимание на физическую сетевую инфраструктуру, чего мы не видели уже много лет.

И это изменение кажется знакомым, если посмотреть на то, что происходит в облачных вычислениях.

От приоритета облака к подходу, ориентированному на рабочие нагрузки

Когда публичное облако впервые получило широкое распространение, его преимущества были преобразующими: мгновенная масштабируемость, быстрое предоставление ресурсов, операционная свобода от необходимости поддерживать обширную инфраструктуру центров обработки данных и экономика оплаты по факту использования. Предприятия приняли его как способ быстрее внедрять инновации и реагировать на меняющиеся потребности рынка.

Но по мере того, как в систему входят рабочие нагрузки ИИ, их уникальные характеристики все больше влияют на то, где их лучше выполнять. Обучение крупномасштабных моделей может требовать огромных объемов данных, часто петабайтных, которые более эффективно обрабатывать ближе к месту создания или агрегирования этих данных. ИИ-сервисы реального времени, такие как промышленное компьютерное зрение или голосовые помощники в обслуживании клиентов, могут выиграть от выполнения с ультранизкой задержкой, которую проще обеспечить в локальных или периферийных точках. Для организаций, работающих с конфиденциальными или регулируемыми данными, локализация частей рабочего процесса может упростить соблюдение нормативных требований и управление.

Эта эволюция, часто называемая «облачной репатриацией», не означает отказ от облака, а скорее разумное размещение рабочих нагрузок там, где они наиболее эффективны, масштабируемы и соответствуют нормативным требованиям. Публичное облако остается важным для многих приложений ИИ, но теперь оно является частью более продуманной гибридной экосистемы, в которой некоторые рабочие нагрузки ИИ или этапы жизненного цикла ИИ размещаются на специально созданной инфраструктуре для достижения целей производительности и эффективности.

Почему рабочие нагрузки ИИ выходят за рамки виртуальных зон комфорта

В традиционных корпоративных средах даже ресурсоемкие приложения могут хорошо работать с максимальной пропускной способностью Интернета и задержкой, измеряемой десятками миллисекунд. В таких условиях программно-определяемые оверлеи, работающие на стандартном оборудовании пересылки данных, демонстрируют превосходные результаты.

Рабочие нагрузки ИИ меняют эту ситуацию. Обучение больших моделей предполагает постоянное перемещение больших объемов данных между кластерами графических процессоров и хранилищами, что может быстро довести виртуализированные плоскости пересылки данных до предела их пропускной способности. Хотя обучение обычно проводится в дата-центре, инференс теперь начинают перемещать на периферию и в филиалы, что предъявляет новые требования к распределенной инфраструктуре.

Задержка также становится критически важной. ИИ-инференс для аналитики реального времени, координации автономных транспортных средств или промышленной автоматизации может потребовать доставки пакетов за микросекунды, а не миллисекунды. Детерминированная задержка — стабильное и гарантированное время доставки — должна обеспечиваться аппаратно.

Безопасность не менее важна. Данные ИИ часто содержат конфиденциальную интеллектуальную собственность или регулируемую персональную информацию. Шифрование этих потоков данных с высокой пропускной способностью без снижения производительности требует специализированных микросхем, способных обрабатывать данные на скорости линии. А в тяжелых или промышленных условиях, где часто развертывается ИИ, само оборудование должно быть спроектировано для работы в сложных условиях и иногда запускать унаследованные протоколы наряду с современными рабочими нагрузками.

Аргументы в пользу оптимизированного для ИИ сетевого оборудования

Эти требования не отрицают ценность программно-определяемых сетей, а наоборот. Контроллеры, оркестраторы и оверлеи никогда не были так важны для формирования политик, автоматизации предоставления ресурсов и интеллектуальной маршрутизации трафика. Но без оптимизированной для ИИ аппаратной базы эти системы могут оказаться ограниченными.

Представьте себе запуск продвинутой модели ИИ: уровень оркестрации может планировать и управлять задачами обучения, но производительность выполнения обеспечивается графическими процессорами и специализированными ускорителями, созданными для этой рабочей нагрузки. В сетях эта производительность обеспечивается готовыми к ИИ физическими маршрутизаторами, коммутаторами и беспроводными устройствами.

Эти платформы предлагают пересылку пакетов на основе ASIC (специализированных интегральных схем), способных поддерживать пропускную способность терабитного класса. Они обеспечивают аппаратно реализованное качество обслуживания и формирование трафика для контроля задержки на микросекундном уровне. Они готовы к постквантовым технологиям и обрабатывают шифрование и реализуют встроенную защиту от угроз без ущерба для скорости. И они интегрируют телеметрию непосредственно в плоскость пересылки, позволяя операторам отслеживать и оптимизировать потоки данных ИИ в режиме реального времени.

Когда гибкость ПО сочетается с мощью оборудования

Цель состоит не в замене программно-определяемых решений сетями, ориентированными на «железо», а в обеспечении того, чтобы базовая инфраструктура могла поддерживать сложность и интенсивность трафика ИИ. Это естественное расширение обещания программно-определяемых сетей: отделение управления от оборудования при сохранении соответствия физической инфраструктуры требованиям производительности рабочей нагрузки.

Представьте себе развертывание SD-WAN, выбирающее оптимальный путь для приложения ИИ, но этот путь ведет к физическому маршрутизатору, который может пересылать зашифрованные потоки со скоростью 400 Гбит/с без снижения производительности. Или программно-определяемую кампусную сеть, которая сегментирует и приоритизирует трафик ИИ-инференса, что обеспечивается микросхемами коммутаторов, гарантирующими соблюдение соглашений об уровне обслуживания на микросекундном уровне.

ПО оркестрирует и адаптирует; оборудование работает на полную мощность, необходимую для ИИ.

Архитектура для ИИ: гибридный подход к сетям

По мере перехода ИИ от пилотных проектов к производству сетевые стратегии будут следовать модели, принятой в облачной инфраструктуре, становясь более продуманными и учитывающими рабочие нагрузки. Циклы обновления оборудования сократятся, чтобы идти в ногу с достижениями в области маршрутизации и коммутации, а безопасность следующего поколения, включая алгоритмы, устойчивые к квантовым атакам, обеспечит верифицированный доступ, начиная с уровня устройства. При проектировании сети будет явно учитываться размещение рабочих нагрузок ИИ, подобно тому, как сейчас облачные архитекторы выбирают, будет ли код выполняться в облаке, на периферии или локально.

Направление развития отрасли ясно: самые надежные сети для ИИ будут интегрировать программно-определяемую гибкость с оптимизированной для ИИ производительностью оборудования. Эта комбинация позволит инфраструктуре соответствовать беспрецедентным требованиям ИИ к масштабируемости, безопасности и задержке, от ядра облака, через глобальную сеть, до защищенной периферии.

ИИ запускает собственную форму «репатриационного мышления» в сетевых технологиях — не возвращение в прошлое, а перенастройка на будущее. Подобно тому, как облачные стратегии развивались, чтобы размещать рабочие нагрузки там, где они работают наиболее эффективно, ИИ требует баланса между гибкостью программно-определяемых сетей и предсказуемыми возможностями специализированного оборудования. Именно правильный баланс позволит предприятиям в полной мере реализовать потенциал ИИ.