Google Cloud выпустила отчет, в котором рассматриваются пять ключевых трендов-2023, связанных со стратегиями в области данных и искусственного интеллекта, сообщает портал Datanami. В нем отмечается, что потребительский спрос, рыночные условия и технологии ИИ и машинного обучения изменились, а растущая сложность данных создает иной ландшафт, чем даже год назад.
В ходе исследования, проведенного IDC по заказу Google Cloud, было опрошено более 800 глобальных организаций, которым было предложено назвать свои самые большие проблемы в использовании данных, преимущества, которые они получают от облачных решений для работы с данными и ИИ, и то, куда они собираются двигаться дальше с этими решениями.
Тренд 1. Изолированные данные уходят... унифицированные облака данных приходят. В отчете говорится, что к 2026 г. в глобальном масштабе будет генерироваться 7 Пб данных в секунду. В настоящее время только 10% данных являются оригинальными, а остальные 90% — реплицированные. Хранение таких разрозненных данных не приносит пользы организациям, и Google Cloud утверждает, что необходим лучший способ хранения, управления, анализа и регулирования этих данных. В отчете утверждается, что решением может стать унифицированное облако, поскольку оно обеспечивает общую инфраструктуру для размещения баз, хранилищ и озер данных, потоковой передачи данных, BI, ИИ и МО.
Энди Гутманс, генеральный директор и вице-президент Google Cloud по разработке баз данных, говорит, что унифицированное облако данных позволяет интегрировать данные и идеи для трансформации цифрового опыта и принятия решений, и «в результате пользователи могут получать нужную информацию именно тогда, когда она им нужна, для достижения наилучших результатов».
Тренд 2. Открытые экосистемы данных помогают компаниям избежать замкнутости и изолированности данных, позволяя им свободно перемещаться между платформами. Ускорить разработку и снизить затраты помогают готовые Open Source-сервисы и приложения, такие как PostgreSQL, Kafka, TensorFlow, PyTorch, Presto, JanusGraph и проекты Apache. С другой стороны, в отчете отмечается, что открытые стандарты и открытые архитектуры также могут помочь минимизировать плату за перемещение и вывод данных, анализируя данные там, где они находятся.
Тренд 3. Согласно Google Cloud, мы находимся на пороге переломного момента в области ИИ, когда управление облаками данных и ИИ-облаками по отдельности станет невозможным. Приложения, оснащенные ИИ, решают больше проблем и извлекают больше инсайтов из данных, чем когда-либо прежде. Джун Янг, вице-президент Google Cloud по облачному ИИ и отраслевым решениям, говорит, что ученые, аналитики, разработчики и создатели МО сейчас тесно сотрудничают друг с другом, и им нужен единый интерфейс, чтобы инструменты, данные и инсайты были доступны на едином портале. Согласно отчету, 80% организаций утверждают, что наличие в облачной платформе данных встроенной поддержки выполнения моделей ИИ/МО повышает вероятность ее выбора.
Кроме того, предварительно обученные модели и методы обучения low-code помогают компаниям достигать своих целей в области ИИ и МО, предоставляя возможности для гражданских специалистов по данным. В отчете говорится, что 81% организаций утверждают, что увеличение числа таких специалистов существенно улучшило бы их способность применять передовую аналитику в большем количестве проектов.
Тренд 4. Организации переосмысливают BI. Они отказываются от традиционной модели, ориентированной на приборные панели, и переходят на парадигму BI, ориентированную на действия, когда инсайты предоставляются большему количеству людей в большем количестве сред для поддержки большего числа типов рабочих процессов, утверждает Google Cloud. BI и аналитика могут помочь выявить основные тенденции, аномалии данных и глубинные проблемы, и 87% организаций хотят, чтобы их BI-программы поддерживали разработку и развертывание прогнозных моделей. Также растет встраивание BI и аналитики в корпоративные приложения, поскольку организации хотят охватить более широкую внутреннюю аудиторию, а также улучшить приложения, ориентированные на клиентов.
Тренд 5. Управление рисками, связанными с данными, выходит на первый план. Компании стараются лучше знать свои данные, чтобы повысить уровень безопасности, управления и доверия. По мере сбора все большего количества неструктурированных и структурированных данных, необходимость точно знать, какие именно данные собираются, становится жизненно важной для обеспечения их безопасности и соответствия нормативным требованиям. Вручную найти, просканировать и классифицировать каждый набор данных на предмет риска довольно сложно, особенно в таких сценариях, как использование компаниями чат-приложений для общения с клиентами, когда конфиденциальная информация может оказаться в транскриптах чата.
В Google Cloud говорят, что обеспечение видимости всех данных и понимание конвейеров ввода данных и разрозненности хранимых данных — это самый важный шаг в управлении рисками, связанными с данными. Далее следует классификация, и многие организации используют для этого инструменты MО и средства автоматизации бизнеса. Внедрение автоматизированных средств контроля может помочь снизить риски, связанные с хранением и обменом данными. Например, если клиенты предоставляют конфиденциальные данные, автоматизированный процесс может отредактировать конфиденциальную информацию прежде, чем она поступит на хранение. По прогнозам Google Cloud, к 2027 г. 66% крупных предприятий сделают большие инвестиции в технологии плоскости контроля данных, которые позволяют измерять риск, присущий данным, и снижать его за счет обеспечения безопасности и проверки.