Развитие передовых аналитических технологий, таких как машинное обучение и искусственный интеллект, приведет к кардинальному изменению операций по управлению данными. Портал InformationWeek рассказывает об основных тенденциях, которые аналитики Gartner выделили в своем отчете «Data and Analytics Trends-2022».
Хотя эффективное управление данными уже давно является основополагающей практикой для бизнес-аналитики и анализа, в ближайшие годы предприятиям придется приспособиться к тому, чтобы удовлетворить растущие потребности внедрения передовой аналитики — МО и других видов ИИ, прогнозирует Gartner. «Без правильных данных создание ИИ может быть рискованным и даже опасным, — говорит вице-президент Gartner Рита Саллам. — Большинству организаций приходится решать очень важные для ИИ вопросы управления данными, такие как предвзятость, разнообразие, маркировка. Они часто решают эти вопросы бессистемно». Это происходит потому, что сообщество ИИ в основном сосредоточено на разработке моделей.
«Предприятия часто не обладают необходимым набором навыков, или не внедряют процессы, инструменты и практику для управления данными специально для ИИ, — отмечает Саллам. — ИИ, ориентированный на данные, способен кардинально изменить традиционную практику управления данными, а также преобладающую науку о данных, ориентированную на модели, поскольку он требует, чтобы такие специфические для ИИ соображения, как смещение данных, маркировка, дрейф, последовательно применялись для улучшения качества моделей на постоянной основе».
Как обстоят дела с соответствующими инструментами? По словам Салам, есть ряд тенденций, которые будут способствовать улучшению управления данными в ИИ-экосистеме. В частности, ведущие организации перестраивают управление данными для ИИ путем создания ткани данных на основе активных метаданных и инвестирования в управление ИИ.
«Метаданные — это данные в контексте. Это аспекты данных: когда, где, кто, как, — поясняет Саллам. — Ткань данных слушает, учится и действует на основе этих метаданных, а затем применяет непрерывную аналитику к существующим и доступным для обнаружения и выводов активам метаданных».
Среди других тенденций Gartner выделяет адаптивные системы ИИ, которые позволяют организациям быстро приспосабливаться к инновациям, и стремление к постоянному обмену данными, а не к созданию внутренней культуры хранения данных.
Тенденция «всегда делиться данными» устанавливает обмен данными в качестве ключевого показателя эффективности, ориентированного на бизнес. Это помогает достичь эффективного взаимодействия с заинтересованными сторонами и расширить доступ к нужным данным для создания общественной ценности. В качестве примера Gartner приводит пандемию COVID-19, когда обмен данными помог ускорить создание независимых и взаимосвязанных общественных и коммерческих цифровых бизнес-ценностей — от разработки рекомендаций по защите здоровья до создания вакцин.
По словам Саллам, все эти тенденции взаимосвязаны, поскольку в качестве основы необходима ткань данных, а метаданные обеспечивают автоматическое обнаружение активов данных и сервисов.
Еще одна группа тенденций — «расширение возможностей людей и решений», область, которая приоритизирует грамотность персонала в области данных, что является ключевым аспектом для организаций, имеющих стратегические бизнес-цели, основанные на данных. В эту группу тенденций также входят контекстно-обогащенный анализ, данные и аналитика, ориентированные на бизнес, и данные и аналитика, ориентированные на принятие решений.
Последняя группа тенденций обозначена как «институционализация доверия» и включает в себя управление подключенными данными, управление рисками ИИ, экосистемы поставщиков и региональные, а также расширение до Edge. Эта группа также связана со всеми остальными тенденциями.
Аналитик Gartner Тед Фридман говорит, что идея управления данными стала сложнее, потому что организации стали более сложными, а деятельность в области данных и аналитики происходит все более распределенно.
«Инициативы, связанные с управлением данными, осуществляются изолированно или точечно, но они не похожи друг на друга. Они не стандартизированы и не согласованы, — отмечает он. — Именно с этим связана наша идея о взаимосвязанном управлении. Мы наблюдаем развитие очень важной тенденции, когда организации пытаются связать воедино различные связанные с управлением инициативы, которые происходят в их бизнесе».
Эти инициативы включают вовлечение ключевых заинтересованных сторон, включая ИБ-директора (CISO), а также руководителей в области данных и аналитики, которые сосредоточены на управлении данными с точки зрения качества, жизненного цикла и мастер-данных. Фридман добавил, что организации должны говорить об управлении не только данными, но и аналитикой. Это связано с тем, что управление должно охватывать связанные с ИИ артефакты, вещи, которые основаны на данных или являются производными от данных.
Опять же, все эти тенденции взаимосвязаны, поскольку практика работы с данными и аналитикой развивается и становится все более сложной. Организациям следует следить за всеми ними, но сосредоточиться на тех, которые являются приоритетным для них.
«Главные тенденции и технологии в области данных и аналитики не существуют сами по себе, — говорит Саллам. — Вы увидите, что они развиваются все вместе и усиливают друг друга».