Движение данных (Data in Motion) предполагает непрерывное взаимодействие между людьми, процессами, данными и предметами, приводящее к обновлению данных в реальном времени. В зависимости от ситуации здесь требуются различные архитектуры, приложения и методы управления. Управляющий директор Deloitte Consulting Ашиш Верма и старший советник Deloitte AI Томас Давенпорт рассказывают на портале InformationWeek о том, что такое движение данных и как с этим работать.
Раньше собранные данные оставались в одном месте. Они генерировались системой транзакций, далее поступали на склад или в магазин и оседали там, чтобы пользователи могли получить к ним доступ и проанализировать. Однако сегодня данные часто находятся в движении. Они могут исходить от датчика движущегося транспортного средства, затем накапливаться, отправляться в облако, в озеро данных, а затем выныривать из него, чтобы стать основанием для действий и решений. Иногда действия с этими данными осуществляются на периферии сети или в точке их возникновения — в датчике или устройстве.
Современный бизнес имеет дело со множеством сред, в которых данные находятся в движении, в том числе:
- связанные цепочки поставок, в которых ключевые компоненты и товары генерируют сенсорные данные, позволяющие оптимизировать работу в режиме реального времени, обнаруживать аномалии, прогнозировать проблемы и решать их;
- мониторинг здоровья пациентов и потребителей, когда системы электронного хранения и обработки медицинских данных, носимые устройства, домашний мониторинг и т. д. предоставляют информацию о текущем состоянии здоровья. Телемедицина позволяет посетить лечащего врача «на ходу»;
- данные в движении на спортивных и развлекательных площадках значат, что болельщики в режиме реального времени смогут обзавестись билетами, получить особые впечатления и доступ инструментам навигации.
Почему сейчас появляется больше данных в движении
Существует несколько факторов, объясняющих, почему данные все больше и больше приходят в движение. Набирает популярность Интернет вещей, данные генерируют датчики на товарах, контейнерах и различного рода машины. Скорость передачи мобильных данных также стремительно растет. К широкому внедрению готовы процессоры с ИИ для развертывания на периферии сети, ожидается, что в 2020 г. на рынок их будет поставлено более 750 млн. (продажи превысят 1,5 млрд. долл.). Эти устройства станут генерировать сенсорные данные, которые будут храниться, обрабатываться и анализироваться вблизи или на периферии сетей. Беспроводные сети 5G в конечном итоге будут доминировать на рынке по скорости, задержке, проникновению и пропускной способности.
Что касается клиентов, у большинства из них есть смартфоны, и они рассчитывают использовать их для взаимодействия с компаниями, чтобы повысить уровень комфорта и мобильность. Это особенно связано с COVID-19: в пандемию возросла необходимость в виртуальном и интеллектуальном взаимодействии по работе, для совершения покупок, получения медицинских услуг и развлечений. Но датчики, мобильные устройства и виртуальная жизнь — не единственные факторы, приводящие данные в движение. Организации нуждаются в новых инструментах для использования и анализа движущихся данных, и с этим связаны новейшие трансформации в аналитике и ИИ. Вместе они формируют тенденции, которые делают движение данных неизбежным.
Реконструкция данных, требуемая для того, чтобы подготовить их к движению
Чтобы управлять подвижными данными предприятиям придется преобразовать и модернизировать свои архитектуры. Проверенные временем архитектуры, которые хорошо подходили для статичных данных, плохо подходят для мобильных данных. Архитектуры данных в движении — сложные и состоят из нескольких уровней для анализа и обработки данных; помимо локальных сетей они не могут обходиться без глобальной сети.
Большинство из них будет включать более гибкий облачный компонент, позволяющий хранить данные в нескольких форматах, чтобы их можно было легко интегрировать и агрегировать. Облачные архитектуры также решают вопросы безопасности данных, управления идентификацией клиентов и продуктов, регулирования конфиденциальности данных и их круглосуточной доступности. Поставщики облачных услуг уже предлагают специализированные приложения, которые могут помочь в определенных случаях использования данных в движении, например, набор облачных сервисов для подключенных транспортных средств. Как правило, для хранения больших объемов IoT-данных в облаке или онпремис хорошо подходят озера данных, где они складируются в различных форматах и не требуют трудоемкого процесса ETL.
Данные в движении могут пребывать в различных ситуациях. В зависимости от этого им требуются различные архитектуры и приложения. Эти состояния бывают следующими:
- данные перемещаются, а актив — нет. Подобная ситуация может возникнуть на «умной» фабрике, когда данные поступают внутрь объекта и за его пределы, но сам объект является статичным;
- активы и данные перемещаются. Подобная ситуация характерна для подключенного транспортного средства. Оно принимает данные и отправляет их вовне даже пребывая в движении;
- указанные выше ситуации зависят от времени. В цепочках поставок данные могут оставаться внутри «умной» фабрики, а затем стать частью отгрузки или компонента, когда те двигаются по цепочке на склад или магазин.
Самые сложные архитектуры — это когда двигаются и актив, и данные. Ожидается, что широкое применение сетей 5G, которые только начинают развертываться, приблизит этот тип архитектур к реальности.
Управление данными в движении
Существует также множество проблем управления, требующих решения: мониторинг доступности полосы пропускания и времени отклика, а также стратегии для ложных аномалий, генерируемых датчиками. Кроме того, потребление и анализ данных можно частично автоматизировать, но здесь возникает другая проблема — «человек посередине», который отслеживает результаты и действует в соответствии с ними. Поскольку человеческий компонент ненадежен, он может вызвать те же проблемы, что и неисправный датчик или отключение облака. Необходимо будет уделять постоянное внимание вопросам конфиденциальности данных клиентов и разрешений на их использование.
Учитывая тот факт, что подвижные данные могут покидать организации, остро встает вопрос владения данными, который необходимо решить. Например, на право собственности при упоминании данных о реактивных двигателях для прогнозного технического обслуживания самолетов могут претендовать производители двигателей, корпусов, авиакомпании и даже ассоциация пилотов авиакомпаний.
Ваши данные в движении
Несмотря на проблемы, связанные с движением данных, организациям пора двигаться вперед. Вероятно, у вас уже есть такие данные или возможности для их создания. Ваши сотрудники, клиенты, продукты, детали и оборудование находятся в движении, и вам необходимо знать, где они находятся и что делают. Маловероятно, что ваша текущая технологическая среда сможет справиться с этими требованиями — для этого нужна стратегия, архитектура и план управления.