Распределяя задачи между периферией и облаком, мы можем оптимизировать приложения искусственного интеллекта с точки зрения скорости, эффективности, безопасности и конфиденциальности, пишет на портале The New Stack Луис Сезе, соучредитель и генеральный директор компании OctoML.
Концепции выбора и доступности играют ключевую роль в максимизации воздействия ИИ.
В мире ИИ облака традиционно являются рабочей лошадкой. Они обеспечивают огромные ресурсы для сложных вычислений и огромных объемов данных, необходимых для обучения моделей и поддержания экстремальных требований к вычислениям при развертывании в масштабе.
Однако по мере масштабирования и распространения ИИ задержки, проблемы конфиденциальности, ограничения на подключение и пропускную способность сети лимитируют максимально возможное влияние ИИ. Периферийное развертывание ИИ компенсирует некоторые из этих ограничений, особенно для приложений, требующих немедленной обработки данных, со строгими ограничениями по задержкам и требованиями к доступности. Кроме того, оно решает проблемы конфиденциальности и безопасности, сохраняя конфиденциальные данные локализованными.
Это не должно никого удивлять. Это напоминает времена первых облаков, когда удаленное размещение данных и приложений обеспечивало повышение эффективности с точки зрения стоимости, производительности и возможности быстрее выводить продукты на рынок. Но и в те времена решение не было альтернативным; это была гибридная комбинация, которая обеспечивала гибкость, необходимую для любой организации и проекта.
Переход от преимущественно облачного генеративного ИИ (GenAI) к вариантам «периферия плюс облако» напоминает эволюцию веб-приложений. Вначале веб был преимущественно серверным, с «тупыми» браузерами, которые в основном взаимодействовали с пользователем, но по мере развития они постепенно вбирали в себя как логику приложений, так и пользовательский интерфейс.
Переход в ИИ к периферийным вычислениям, подобно переходу к продвинутым браузерам, напоминающим операционные системы, устраняет эти ограничения и обеспечивает гибкость, необходимую для различных приложений и проектов ИИ.
Жизнь на периферии
Edge-развертывание приложений ИИ дает множество преимуществ, которые меняют технологический ландшафт.
Одно из самых значительных — «постоянная доступность». Локальное развертывание моделей ИИ устраняет зависимость от внешних сетевых соединений или удаленных серверов, сводя к минимуму риск простоев, вызванных техническим обслуживанием, отключениями или проблемами с подключением. Такой уровень отказоустойчивости особенно важен в чувствительных отраслях, таких как здравоохранение, где бесперебойное обслуживание абсолютно необходимо.
Периферийные развертывания также обеспечивают низкую задержку, поскольку скорость света является фундаментальным ограничивающим фактором, и при доступе к удаленной облачной инфраструктуре может возникать значительная задержка. Благодаря все более мощному оборудованию, доступному на периферии, здесь можно обрабатывать данные, которые физически находятся рядом.
Еще одно преимущество — возможность использовать специализированное оборудование, адаптированное к потребностям организации, оптимизировать производительность и эффективность, не страдая от ограничений по задержкам и пропускной способности сети, а также ограничений по конфигурации, накладываемых облачными провайдерами.
Наконец, периферийные развертывания позволяют централизовать крупные общие активы в безопасной среде, что, в свою очередь, упрощает управление хранилищем и контроль доступа, повышая безопасность и управляемость данных.
Чем хорошо облако
Периферийные развертывания обладают привлекательными свойствами для ИИ-приложений, но и облачные развертывания тоже.
Облачные среды часто могут предоставлять огромные вычислительные ресурсы, что делает их идеальными для задач, требующих большой вычислительной мощности. Сложное моделирование, обработка больших объемов данных и высокопроизводительные вычисления — вот области, в которых облако является идеальным решением.
Облачные решения обеспечивают доступ к множеству онлайн-источников данных и сервисов. Это может оказаться бесценным, если модели ИИ требуют обновления данных в режиме реального времени или доступа к обширным массивам данных, размещенным в облаке.
Облачные среды также хорошо подходят для непрерывного обучения моделей. Они могут эффективно управлять процессом обучения и распределять его по нескольким ресурсам, обеспечивая постоянное обновление моделей ИИ на основе самых свежих данных.
Сама по себе периферия не является панацеей. Облачные вычисления играют важную роль, особенно в решении задач, требующих огромных вычислительных мощностей и анализа исторических данных.
Периферия + облако = демократизация ИИ
Синергия между периферийными и облачными решениями неоспорима, они образуют гибридную экосистему, которая максимально раскрывает потенциал приложений ИИ, удовлетворяя их уникальные требования. Она сочетает в себе низкую задержку, конфиденциальность данных и преимущества кастомизации периферийных развертываний с масштабируемостью и обширными ресурсами облачных вычислений, предлагая комплексное решение для различных ИИ-сценариев.
Распределяя задачи между периферией и облаком, мы можем оптимизировать приложения ИИ с точки зрения скорости, эффективности, безопасности и конфиденциальности.
Но дело не только в этом — подход «облако плюс периферия» демократизирует ИИ, позволяя ему эффективно функционировать даже в удаленных районах с ограниченным доступом в Интернет. Это решение может открыть беспрецедентные возможности для развития ИИ в слаборазвитых регионах, преодолевая цифровой разрыв, который грозит оставить многих позади в ИИ-революции.