Чтобы получить максимальную отдачу от данных, ИТ-специалистам нужно знать, как использовать алгоритмы машинного обучения для назначения и типизации данных в режиме реального времени или в традиционных облачных процессах. Об этом на портале TechTarget рассказывает BI-директор Lucina Health Скот Робинсон.
Технология Интернета вещей набирает размах, предоставляя предприятиям новые возможности, а вместе с ней растет значение другой технологии — граничных, или периферийных вычислений (edge computing). Чтобы справляться с обработкой лавины нарастающей информации, организациям нужно научиться правильно управлять IoT-данными, а также повысить безопасность периферийных вычислений.
Темп роста IoT не только всеохватный, но он еще на несколько порядков выше, чем рост облачных сервисов. По данным Gartner, к концу следующего года число подключенных устройств достигнет почти 40 млрд., поэтому организациям, которые занимаются IoT, необходимо обзавестись инфраструктурой для периферийных вычислений.
Однако самую большую проблему представляет обеспечение безопасности — охват IoT настолько широк, что дарит хакерам практически неисчерпаемые возможности для атак. Чтобы защитить IoT-сети, для блокировки выходных данных потребуется установка граничных шлюзов (edge gateway).
Однако значение периферийных вычислений гораздо больше, чем обслуживание базовых нагрузок IoT.
Защита, обмен и очистка IoT-данных
Большую часть нагрузки на edge-серверы создает канал между IoT и облаками, в который девайсы отправляют трафик, на него также возлагается защита данных. В крупномасштабных сценариях, таких как управление трафиком и операции в цепочке поставок, граничная обработка может включать динамическую маршрутизацию IoT-данных в несколько облаков, включая облака партнерских организаций. Нужно исходить из того, что природа данных IoT — облачная, а устройства, которые их генерируют, с точки зрения функциональности не соответствуют никаким универсальным стандартам и протоколам, включая стандарты безопасности и отказоустойчивости. Эксплуатация в сетях IoT оборудования может растянутся на 20 лет, что сделает данные более шумными, т. е. поврежденными или искаженными либо имеющими низкое отношение сигнал/шум. Неправильные процедуры вычитания шума в данных могут привести к ошибочным выводам. Так что еще одна задача edge-серверов — борьба с шумом.
Большие проблемы с откликом в режиме реального времени и поддержкой принятия решений
Серьезные проблемы вызывают не только обеспечение безопасности и маршрутизация данных, но и управление ими. Можно сказать, что это самая большая проблема: схема работы IoT-сетей предполагает немедленное реагирование или поддержку принятия решений в режиме реального времени, например, во время сбоя на заводе или помех в системе распределения трафика. Подобные ситуации встречаются все чаще и не оставляют времени на то, чтобы связаться с облачным провайдером, проанализировать данные и решить проблему путем их отката. IoT — технология реального времени, поэтому ответ должен быть получен не за часы и не минуты, а за считанные секунды.
Обе эти неблагоприятные ситуации требуют динамического ответа. Среди прочего IoT-технология разрабатывалась с целью немедленного реагирования на изменения в физической среде (внезапное изменение температуры или возникновение неисправности в оборудовании), а также для вмешательства в сложные рабочие процессы, когда те выходят из строя в результате непредвиденных ситуаций, к примеру, дорожно-транспортного происшествия с участием грузового транспорта. Реакция на событие (инцидент) должна быть динамической, с чем может неплохо справиться искусственный интеллект. Когда время или возможности задействовать людей ограничены, алгоритмы ИИ — лучший способ справиться с ситуациями, которые требуют безотлагательной реакции. Фактически, IoT-сеть должна быть «умной» — способной мгновенно принимать решения.
Структура периферийных вычислений подразумевает, что данные IoT должны анализироваться не только в части того, что идет в домашнее или партнерское облако, но и в части того, какие данные нужны процессам реального времени, а какие — более медленным. Что касается первых, ИТ-администраторам нужно отфильтровать их в первую очередь, тогда как пакетные данные можно отправить во временное хранилище, и затем, по мере необходимости, в облако.
Периферийные вычисления совершенствуются
Передовая практика управления данными включает в себя два ключевых нововведения. Во-первых, задачи по управлению ими, в том числе управление транспортировкой, должны выполняться средствами периферийной, а не облачной инфраструктуры. Как правило, IoT добавляет новую архитектуру к существующей централизованной технологии, поэтому лучше всего для управления новыми данными, которые скапливаются на периферии сети, применять нисходящий подход. Облачные системы утратили значение централизованной конечной точки — теперь они являются одним из целевых направлений, поскольку значительное количество процессов в IoT перешло на периферию сети. Исходя из этого, данные лучше всего администрировать с периферийных серверов, которые их собирают, тем более что их маршрутизация и применение могут быть динамическими.
Во-вторых, до тех пор, пока индустрия корпоративного ПО не разработает технологию «под ключ», наиболее экономичным и эффективным способом управления данными являются пользовательские каналы и микросервисы, которые в децентрализованных процессах легко обслуживаются и расширяются. Также не доставит больших сложностей создание панели мониторинга для анализа трафика данных. Python будет отличным кандидатом на роль языка программирования, который подойдет для этой цели.
Как уже говорилось, ценность IoT состоит в немедленном отклике на изменения в физическом мире или поддержке принятия решений в режиме реального времени, но что касается аналитики и ИИ, то лучше всего их отделить от технологии IoT, оставив модель и процессы машинного обучения в облаке. По мере изменения модели в порядке очередности будут обновляться и алгоритмы, генерирующие IoT-аналитику. Для трансляции в сеть алгоритмов требуется выполнить дополнительной объем работы, но он гораздо меньше, чем развертывание машинного обучения на периферии сети — там его сложно поддерживать и еще сложнее обезопасить.
Отраслевые стандарты для периферийных вычислений еще не выработаны, однако их безопасность является ощутимой проблемой, поэтому ответственность за ее обеспечение должна взять ИТ-команда, которая занимается развертыванием периферийной инфраструктуры. Для поддержки управления IoT-данными и edge-процессов в нее требуется включить архитекторов данных и архитекторов корпоративных решений. Следует также помнить, что маршрутизация и процессинг в режиме реального времени невозможны без эффективного моделирования данных и оптимизированного рабочего процесса.