На периферии важное значение имеет задержка, а для эффективной работы искусственного интеллекта и машинного обучения требуется много данных. О том, что это значит для рабочих нагрузок ИИ/МО, рассказывают опрошенные порталом Enterprisers Project эксперты.
Периферия имеет значение там, где важна задержка, и наоборот. А задержка почти всегда имеет значение, когда речь идет о рабочих нагрузках ИИ/МО. «Хороший ИИ требует данных. Великому ИИ требуется много данных, и он требует их немедленно», — говорит Брайан Сатианатан, технический директор Iterate.ai.
Это одновременно и благословение, и проклятие для любого сектора — промышленный и производственный являются яркими примерами, — но данный принцип применим во всех отраслях бизнеса, генерирующего тонны машинных данных вне своих централизованных облаков или дата-центров и намеревающегося передавать их в модель MО или другую форму автоматизации для любых целей.
Работаете ли вы с данными IoT на заводе или с данными медицинской диагностики в учреждении здравоохранения — или с одним из многих других сценариев, в которых применяются ИИ/МО, — вы, вероятно, не сможете делать это оптимально, если будете пытаться отправлять все (или почти все) данные по кругу от периферии до облака и обратно. Более того, если вы имеете дело с огромными объемами данных, ваша затея может так и не начаться.
«Я видел ситуации на производстве, когда „слишком много“ данных проходит от робота в цеху через локальную сеть, затем в облако и обратно, — рассказывает Сатианатан. — В этом нет ничего хорошего, потому что, как известно CIO производственных предприятий, решения должны приниматься мгновенно, чтобы быть эффективными».
Даже если вы не достигаете порога, когда данных «слишком много», ценность ИИ/МО — и автоматизации в целом — во многом определяется скоростью. И это первое, что должны знать ИТ-руководители об использовании рабочих нагрузок ИИ/МО в периферийных средах: скорость имеет значение, а ее противник — задержка — может стать убийцей.
Рассмотрим эту и несколько других реалий, связанных с ИИ/МО на периферии.
1. Скорость имеет значение
Подчеркнем все вышесказанное: ценность данных IoT — или любых других данных в периферийных средах — очень часто связана со скоростью, с которой их можно обрабатывать, анализировать и принимать меры.
В большинстве контекстов автоматизации быстродействие измеряется малыми долями секунды. «Передача данных с интеллектуального устройства в облако для запуска модели МО, а затем передача результатов этой модели обратно на интеллектуальное устройство занимает слишком много времени в тех сценариях, когда важны миллисекунды дополнительной задержки», — говорит Крис Макдермотт, вице-президент по разработке компании Wallaroo.ai.
Независимо от того, является ли ваша «периферия» транспортным средством, коммунальным предприятием, сборочной линией или одной из множеством других сред, где скорость имеет значение, затраты — как финансовые, так и иные — на транзит данных и задержку, вероятно, будут слишком велики, чтобы их нести. «В этих ситуациях самое быстрое место для запуска ИИ будет на периферии», — утверждает Макдермотт.
2. Периферийные среды — самое подходящее место для использования ИИ/МО прямо сейчас
По мнению Макдермотта, наибольший рост применения ИИ в настоящее время будет происходить в разнообразных условиях, которые можно определить как «периферию» — будь то завод по производству автомобилей или сам автомобиль после того, как он выехал на дорогу. То же самое касается бытовой техники, электростанций и огромного списка других объектов, которые в настоящее время эффективно используются в качестве ИТ-сред.
Чтобы представить себе масштаб, Макдермотт отмечает, что раньше полупроводниковая электроника составляла около 5% стоимости решения. Сегодня она превышает 40% стоимости.
Будь то на заводе или на нефтяной вышке, ИИ и другие формы автоматизации все больше требуют «приближенности» — то есть, вычислительной мощности и другой ИТ-инфраструктуры поблизости.
Это согласуется с другой масштабной тенденцией в области периферийных вычислений: по мере развития технологии расширяются возможности. По словам Сатьянатана, это верно с точки зрения аппаратного обеспечения и архитектуры в производственных условиях. «Сейчас становятся доступны достижения в области ИИ и периферийных серверов с архитектурой, ориентированной на GPU, и для CIO производственных предприятий хорошим решением будет начать размещать приложения ИИ на периферии», — говорит он.
Это также верно с точки зрения ПО и эксплуатации. Управление — одна из ключевых проблем в периферийных средах в целом, и вы не можете отправлять специалиста службы поддержки на каждый периферийный узел каждый раз, когда что-то идет не так. Проекты с открытым исходным кодом, например MicroShift, помогают расширить на периферию критически важные платформы, такие как Kubernetes, и обеспечить их согласованность.
3. Это не выбор «все или ничего»
Как и большинство других аспектов стратегии периферийных вычислений —как и стратегий облачных вычислений — это не обязательно решение «за» или «против». Это вдвойне верно, когда речь идет о выполнении рабочих нагрузок ИИ/МО на периферии.
Технологический евангелист Red Hat Гордон Хафф сформулировал ряд положений о ценности использования преимуществ устоявшихся шаблонов в архитектуре edge, и один из них таков: вы можете вести разработку централизованно, а выводы делать локально. «В число портфельных архитектур, имеющих непосредственное отношение к edge, входит промышленная периферия, которая применима в нескольких вертикальных отраслях, включая производство, — говорит он. — Она описывает маршрутизацию данных датчиков для двух целей: разработка модели в головном дата-центре и получение выводов в реальном времени в заводских дата-центрах».
Существует также фактор оптимизации затрат: в средах IoT (или в любой среде, где машины генерируют значительное количество данных) объем информации потенциально огромен. Но это не значит, что вся она необходима. «Важно выделять сценарии, в которых телеметрические данные поступают в таком объеме, что затраты на транспортировку и хранение в облаке являются существенными, особенно если 99% телеметрических данных не используются для дальнейших целей, — говорит Макдермотт. — В таких случаях предприятия предпочитают выполнять модели на периферии и передавать в облако только те данные, которые имеют значение».
Другими словами: вы, вероятно, уже понимаете, что такое гибридное облако, и для вас не станет проблемой понимание гибридной периферии.
4. Реализация ИИ/МО на периферии может быть более безопасным
Существует множество сценариев, в которых безопасность приложения MО (или другой автоматизации) может потребовать хранения конфиденциальных данных на месте.
Безопасность периферийных сред сама по себе является предметом повышенного внимания ИТ-руководителей, их внедряющих или увеличивающих здесь свое присутствие. Периферийные среды имеют свои собственные особенности в плане безопасности, но общая истина здесь такова: когда данные перемещаются из среды в среду, поверхность угроз расширяется. Хранение конфиденциальных данных на периферии может быть самым надежным способом их защиты.
Оценки безопасности могут быть разными, также могут быть просто практические соображения, когда подключение к публичному/открытому Интернету не идеально — или невозможно. «В некоторых средах подключение к открытому Интернету заблокировано, поэтому ИИ придется работать на периферии, — говорит Макдермотт. — Можно представить себе удаленные места, таких как нефтяные вышки или газопроводы, или даже объекты в космосе, где связь ненадежна, или высокозащищенные системы, которые не могут быть подключены к открытому Интернету. В этих сценариях МО должно работать на периферии».