Портал Datanami приводит прогнозы ряда отраслевых экспертов о том, что будет происходить в сфере корпоративных данных в 2023 г.
Показать себя
По мнению Александра Лавелла, руководителя отдела продуктов компании Fivetran, в
Реванш SQL
В 2023 г. пользователи SQL наконец-то смогут позлорадствовать, считает Майк Ваас, генеральный директор и соучредитель компании Datometry: «Отказавшись от своего первоначального боевого клича покончить с SQL, сообщество NoSQL признало, что корпоративные ИТ требуют стандартов, а вместе с ними и простоты общего, но мощного языка запросов. Практически каждая база данных NoSQL, которая еще жива, в настоящее время находится в процессе добавления SQL или SQL-подобного интерфейса. Состоится реванш SQL, когда практически любая СУБД, которая хочет быть успешной на предприятии, будет стараться выглядеть как надлежащая».
Ткань и сетка данных
Как отмечает Анхель Винья, генеральный директор и основатель компании Denodo, данные исторически проходят через фазы распределенности и централизации. Однако в настоящее время мы находимся на стадии распределенности, и данные вряд ли снова соберутся вместе, что требует новых подходов к работе с ними, включая ткань данных (data fabric) и сетку данных (data mesh).
«Между этими двумя понятиями есть внутреннее различие: data fabric — это композитный стек технологий управления данными, а data mesh — это ориентация на процесс, позволяющий распределенным группам команд управлять корпоративными данными так, как они считают нужным, — говорит Винья. — И data fabric, и data mesh могут играть критически важную роль в доступе, интеграции, управлении и доставке данных в масштабах всего предприятия, если они правильно построены и имеют соответствующую инфраструктуру». По его мнению, в 2023 г. можно ожидать быстрого роста внедрения обоих архитектурных подходов на средних и крупных предприятиях.
Постмодернистский стек данных
Гипермасштабирование данных
Крис Гладвин, основатель компании Cleversafe, специализирующейся на объектном хранении данных (приобретена IBM в 2015 г. за 1,3 млрд. долл.), знает толк в масштабировании больших данных. Теперь, создав свой третий стартап — поставщика хранилищ данных Ocient, — он прогнозирует, что
«Предприятия, интенсивно использующие данные, переходят от больших данных к гипермасштабируемым, которые растут экспоненциально. И это требует переоценки инфраструктуры данных. В 2023 г. поставщикам хранилищ данных придется разрабатывать новые способы создания и расширения систем и услуг, — говорит Гладвин. — Технологи должны планировать не только общий объем данных, но и рост наборов данных и рабочих нагрузок. Некоторые передовые ИТ-организации сегодня работают с наборами данных, состоящими из миллиардов и триллионов записей. В
DPA и обмен без копирования
Мэтт Кэрролл, генеральный директор и соучредитель компании Immuta, считает, что в 2023 г. мы станем свидетелями роста применения соглашений об обработке данных (DPA) и обмена данными без копирования.
«DPA станут стандартными элементами контрактов SaaS и переговоров об обмене данными. То, как организации будут работать с этими договорами, в корне изменит инфраструктуры данных и определит бизнес-ценность данных. Руководители в области данных будут все больше заинтересованы в том, чтобы полностью внедрять DPA. Эти объемные документы будут сложными, но оцифровка DPA и привлечение юридических специалистов значительно упростят их понимание и реализацию», — поясняет он.
Кроме того, по словам Кэрролла, обмен данными без копирования станет новым стандартом, поскольку обмен данными продолжит расти, а команды по работе с данными и ИТ-специалисты окажутся в цейтноте. По мере того, как организации будут создавать современные стеки данных, произойдет взрывной рост размеров и количества наборов данных. Создавать копии перед обменом станет практически невозможно. Предприятия будут стремиться использовать такие платформы, как Snowflake Data Exchange и протокол Delta Sharing от Databricks, чтобы упростить безопасный обмен данными и их монетизацию.
Год приложений, основанных на данных
Как считает Дхруба Бортакур, соучредитель и технический директор компании Rockset и инженер-основатель RocksDB,
«За последние 10 лет мы наблюдали рост веб-приложений и приложений для телефонов, но
Освоение клиентских данных
Директор по продуктам компании Tamr Энтони Дейтон надеется на прогресс в 2023 г. в плане чистоты данных. «„Мусорные“, или „грязные“ данные — это данные неправильные, неполные, непоследовательные, устаревшие, дублирующиеся — или все вышеперечисленное, которые могут убивать ваш бизнес. Это распространенная проблема, которая часто обостряется в циклические периоды, когда вам больше всего нужны работающие данные о клиентах, — например, во время праздничных покупок и путешествий, — отмечает он. — Избежать путаницы и разочарования, а также облегчить своим клиентам опыт покупок и путешествий можно, освоив данные о своих клиентах. Это позволяет создать единое, точное и обогащенное представление данных о клиентах в различных системах и источниках, а также уникальный идентификатор, позволяющий последовательно отслеживать клиента. И в масштабе компании дает командам по продажам, маркетингу и работе с клиентами мощный способ ускорить продажи на основе данных. Не говоря уже о конкурентных преимуществах».
Долой барьеры между рабочими нагрузками
Как гласит старая поговорка, «за хорошим забором — хорошие соседи». Но это не относится к корпоративным рабочим нагрузкам, считает Энди Гутманс, вице-президент и генеральный менеджер баз данных Google в Google Cloud, который утверждает, что барьеры между транзакционными и аналитическими рабочими нагрузками начнут исчезать в 2023 г.
«Традиционно архитектуры данных разделяли эти рабочие нагрузки, поскольку для каждой из них требовалась своя база данных. Транзакционные базы оптимизированы для быстрого чтения и записи, а аналитические — для агрегирования больших наборов данных, — говорит он. — С развитием облачных архитектур данных, которые используют высокомасштабируемые, дезагрегированные вычисления и хранилища с высокопроизводительными сетями, мы прогнозируем появление новых архитектур баз данных, которые позволят выполнять как транзакционные, так и аналитические рабочие нагрузки в рамках одной системы, не требуя от приложений компромиссов в отношении требований рабочих нагрузок».
От больших данных к «умным»
В последнее время много говорят о якобы смерти больших данных. Не верьте этой шумихе, призывает Кристиан Бакнер, старший вице-президент по аналитике данных и IoT компании Altair. По его словам, поставщики будут пытаться опередить тенденции, рекламируя использование «умных» данных как альтернативу Big Data для получения более глубоких знаний. «Но, несмотря на всю эту рекламу, большие данные пока продолжают играть важную роль в бизнес-операциях. Главное — убедиться, что у вас есть простые в использовании инструменты самообслуживания, позволяющие очищать, проверять и подготавливать данные, которые затем можно подключить к модели анализа данных для получения ценных результатов и принятия обоснованных решений. В перспективе компании, которые превратят свои большие данные в „умные“, будут теми, кто выиграет от нового подхода к данным».
Питон спешит на помощь
По словам Торстена Грабса, директора по управлению продуктами компании Snowflake, на помощь в сфере демократизации данных в 2023 г. придет Python.
«Python станет более пригодным для корпоративного использования, поскольку инфраструктура среды выполнения становится все более простой и понятной, а также включает в себя больше средств безопасности и управления. В то же время, получать результат с помощью Python станет проще, а накопленный пользовательский опыт поможет легче его воспринимать и понимать пользователям, не связанным с ИТ, например, маркетинговой команде компании, — говорит он. — Python окажет такое же или, скорее всего, даже большее преобразующее воздействие на демократизацию данных, чем появление инструментов самообслуживания для бизнес-аналитики