Чтобы получить чистые данные, которым можно всецело доверять, предприятиям требуется комплексный подход в области инженерии данных, который включает в себя обнаружение и ввод данных, интеграцию источников информации, подготовку и управление данными. Вице-президент Informatica по региону EMEA Грег Хэнсон рассказал порталу Information Age о его преимуществах для осуществления успешных ИИ-инициатив.
Потенциал искусственного интеллекта и прогнозной аналитики воодушевляет бизнес-лидеров, поскольку они понимают, что обе технологии могут значительно повысить эффективность работы их организаций. Обнаружение мошеннических схем, выбор «следующего наилучшего действия» и анализ прогнозов — это лишь небольшая часть бизнес-задач, которые ИИ и аналитика помогают решить.
Однако некачественные данные препятствуют корректной работе ИИ — это связано с тем, что качество моделей машинного обучения напрямую зависит от качества данных, по которым они обучаются или которые им передаются для обработки. «Если вернуться к истокам больших данных, станет ясно, что многих специалистов не устраивало их качество, — сказал Хэнсон. — Работающие над ИИ-проектами сотрудники ошибочно полагают, что механизм ИИ умеет удалять несоответствия и неточности данных в автоматическом режиме. Это в корне неверный подход: если вы вводите мусор, то получите его и на выходе».
Улучшение качества данных
По словам Хэнсона, чтобы повысить качество данных предприятиям нужно предварительно создать централизованный каталог активов. Он позволит осуществлять сбор и поиск данных, что приведет к принятию обоснованных решений. «Упорядоченные, более полные и объективные наборы данных помогут организациям должным образом обучить свои алгоритмы ИИ и машинного обучения», — сказал он, добавив, что это можно сделать с помощью хороших инструментов для инжиниринга данных со встроенным ИИ. «Нам нужен не просто ИИ на уровне аналитики, который дает лучшее представление о данных путем графических образов или который помогает принимать решения в режиме реального времени. Необходимо убедиться, что в бэкэнде у нас есть ИИ, который обеспечивает поступление в аналитические движки отобранных данных», — утверждает эксперт.
Он предупредил, что если организации не примутся за упорядочение своих данных, то в будущем им не удастся воспользоваться преимуществами аналитического ИИ. «По моему мнению, ИИ нужно обучать при помощи высококачественных, хорошо подготовленных данных. Это непременное условие, которое позволит избежать множества ошибок, некоторые из которых могут привести к серьезным последствиям», — сказал Хэнсон. Он отметил, что если наборы данных не будут качественными, то сторонники применения ИИ в организациях не получат ожидаемых результатов. Это может помешать будущим инвестициям в технологию.