Будущее распределенных вычислений потребует централизованной облачной инфраструктуры и бизнес-модели, а также интеграции корпоративных данных. Это ключевой лейтмотив выступления CEO Microsoft Сатьи Наделлы на мартовской конференции Microsoft Ignite комментирует на портале InformationWeek. Кендалл Кларк, генеральный директор Stardog, поставщика платформы Enterprise Knowledge Graph (EKG).

Сатья Наделла четко обозначил, что будущее облака — истинно распределенные вычисления. Предприятия, управляемые данными, станут подключенными предприятиями. Как следствие, им удастся повысить производительность, снизить риски/затраты и сократить время получения инсайтов/ценности.

Основная цель доклада Наделлы заключалась в том, чтобы сосредоточить внимание аудитории на нескольких ключевых моментах. Два из них жизненно важны не только для Microsoft, но и для всего бизнеса: повсеместные и децентрализованные вычисления, а также суверенные данные и окружающий интеллект (ambient intelligence). Ключом к обеим будущим облачным функциям является инновационная интеграция данных. Наделла считает, что основой революции цифровой трансформации является способ подключения данных в облаке как в его текущей, так и в будущей итерации.

Интеграция данных отстает

Согласно исследованию IBM за 2018 г., в современном цифровом мире доминирует гибридное мультиоблако, так как 85% предприятий имеют активы данных в более чем одном публичном облаке. Такой разброс данных создает серьезную проблему для традиционных стратегий интеграции данных. Наиболее характерной их особенностью является расположение данных на уровне хранения современного ИТ-стека. В результате предприятия тратят много ресурсов на перемещение данных к вычислительным ресурсам, что приводит к негативным, непредвиденным последствиям, таким как семантический дрейф, неопределенность и неэффективность. Согласно недавнему исследованию IDC, в 2021 г. в мире будет создано 59 Зб данных, причем 90% из них будут реплицированы или скопированы.

За последние 30 лет стратегия интеграции данных не претерпела значительных изменений. Как и до появления гибридных мультиоблачных технологий или подъема Интернета, большинство стратегий управления данными основаны на перемещении и копировании данных. Это единственное, что объединяет кластеры Hadoop, дооблачные хранилища данных, хранилища типа snowflake, озера данных, lakehouses (интеграция хранилищ и озер данных) и обычные базы данных. Прежде чем интегрировать, управлять или запрашивать данные, мы перемещаем их в одну или несколько таких систем или располагаем их между ними. Как сказал Наделла, «...сейчас мы находимся на пике централизации».

Будущее за распределенностью

В распределенном мире, который описывает Наделла, децентрализация является следующим эволюционным шагом, поскольку полагаться на репликацию данных уже нереально, особенно с учетом разрастающейся ИТ-среды. Рост объема данных не замедлится, как не ускорится и производительность сети. Под повсеместными и распределенными вычислениями Наделла подразумевает фундаментальное переосмысление стратегии интеграции корпоративных данных, считая его единственным жизнеспособным вариантом работы с информацией.

Во-первых, распределять вычислительные мощности физически эффективнее, чем реплицировать постоянно растущий объем данных по компьютерным сетям с ограниченной производительностью. Это не простая задача, но это правильный подход к решению будущих тенденций. Во-вторых, Наделла предсказывает, что одной из движущих сил распределенных облачных вычислений является рост объема, скорости и разнообразия данных. «Монстр» данных не будет сдерживаться стратегиями централизованных вычислений. Он упоминает федеративные модели, мультимодальные модели и необходимость суверенитета данных — право владельцев данных контролировать свою информацию.

Интеграция данных должна измениться

Если рассматривать пространство управления данными в целом, то последние разработки соответствуют представлению Наделлы о будущем облака, например, подключение данных исходя из их бизнес-значения, независимо от места хранения, в отличие от использования данных, расположенных на уровне хранения. Будущее интеграции данных потребует изменений в облачной инфраструктуре и бизнес-моделях, основанных на централизации. Что еще более важно, для этого также потребуется стратегия интеграции корпоративных данных, способная обеспечить распределенное будущее, полное перспектив и потенциала.