Технологии ИИ нового поколения для предприятий — это то же самое, что смартфоны для тинэйджеров: что-то, что хотят почти все, но не все готовы использовать правильно, пишет на портале Datanami Дэниел Загалес, вице-президент по инженерии данных компании 66degrees.
Для типичного подростка (или тинэйджера) смартфон — это необходимый атрибут, который сигнализирует о зрелости и стремлении к будущему. Но для ответственного владения телефоном подростки должны обладать определенным уровнем социальной и технологической осведомленности.
Подобным же образом большинство предприятий сегодня стремятся использовать современные технологии ИИ, такие как большие языковые модели (LLM). Но в зависимости от степени зрелости их практики управления данными они могут быть готовы или не готовы к внедрению таких технологий.
Я здесь не для того, чтобы давать вам советы по поводу непростого решения о том, стоит ли покупать iPhone 15 вашему подростку. Но что я могу сделать — поскольку я регулярно консультирую компании по этому вопросу — так это помочь вам решить, обладает ли ваш бизнес уровнем зрелости управления данными, необходимым для использования всех преимуществ ИИ.
Почему наступил момент для современного ИИ
Если вам не удавалось игнорировать новости технологий в течение последнего года, вы знаете, что ИИ — один из самых горячих трендов на данный момент. Растущая зрелость технологии генеративного ИИ, в частности, заставила предприятия остро осознать, насколько велик потенциал современных ИИ-решений, и какое конкурентное преимущество они могут получить или потерять в зависимости от того, насколько эффективно они используют ИИ-технологии.
Даже если ваше предприятие еще не начало экспериментировать с такими технологиями, как LLM, сейчас самое время начать. Окно для получения конкурентного преимущества с помощью ИИ нового поколения еще открыто, но оно не будет оставаться таким вечно, и компании, которые не предпримут никаких действий в ближайшее время, останутся позади.
Готова ли ваша стратегия управления данными к ИИ?
Но опять же, если вам нужен ИИ, это еще не значит, что вы готовы к его использованию. Прежде чем вступать в ряды пользователей ИИ, компаниям необходимо оценить свою стратегию управления данными и определить, насколько она готова к внедрению и использованию технологий ИИ следующего поколения.
Полное обсуждение вопросов, которые необходимо рассмотреть в этом контексте, выходит за рамки данной статьи, но здесь мы рассмотрим пять наиболее важных факторов.
1. Качество данных. Старая мантра о «мусор на входе, мусор на выходе» особенно актуальна в контексте ИИ. Если вы обучаете модель ИИ, используя некачественные данные, ваша модель будет принимать некачественные или непоследовательные решения.
Именно поэтому способность оценивать и оптимизировать качество данных является ключевым требованием для использования ИИ. Обеспечение качества данных начинается с определения показателей, отражающих точность, полноту и согласованность ваших данных, а затем измерения этих показателей на регулярной (а лучше — на постоянной) основе. Кроме того, у вас должны быть инструменты и процессы для повышения качества данных, например, путем удаления избыточной информации из наборов данных или исключения выбросов, которые могут представлять собой неточные точки данных.
2. Доступность данных. Вы не сможете далеко продвинуться с помощью ИИ, если алгоритмам и моделям ИИ будет сложно получать доступ к вашим данным. По этой причине вам необходима стратегия управления данными, обеспечивающая их доступность, когда все данные, принадлежащие вашему бизнесу, могут быть легко подключены или интегрированы с приложениями (в том числе приложениями ИИ), которые хотят их использовать.
Важность доступности данных часто очевидна, когда вы имеете дело с «обычными» типами данных, например базами данных. Но не забывайте, что доступность важна и для других типов данных, таких как полуструктурированные, неструктурированные и «темные» данные, которые также могут сыграть свою роль в сценариях использования ИИ.
3. Гибкость данных. Данные, которые доступны только в одном виде и не могут быть реструктурированы, не очень полезны для ИИ. Также как и данные, доступ к которым возможен только в небольшом масштабе или при определенных конфигурациях.
Чтобы максимально использовать возможности ИИ, вам нужны максимально гибкие данные. Независимо от того, с каким объемом данных вы работаете, как они структурированы и где хранятся, ваши инструменты и процессы управления данными должны позволять вам применять их для любого сценария использования ИИ. Иногда для этого требуется внести изменения, например перенести данные на новую платформу хранения или преобразовать их в другой формат.
4. Администрирование данных. Одна из ключевых проблем, связанных с современным ИИ, заключается в том, что вы не всегда знаете, что модель ИИ делает с вашими данными, особенно если вы работаете со сторонними ИИ-сервисами.
Именно поэтому администрирование данных (data governance) является важнейшей составляющей ответственного использования ИИ. Оно позволяет компаниям устанавливать правила использования различных информационных ресурсов. Например, у вас могут быть данные, которые слишком чувствительны, чтобы предоставлять их сторонним ИИ-сервисам. С помощью политик администрирования данными вы можете разработать четкие правила, определяющие, как модели ИИ могут использовать данные.
5. Надзор. Установить правила администрирования данных — это одно. Другое дело — обеспечить их соблюдение, и тут на помощь приходит надзор (data stewardship).
Такой надзор позволяет внедрить процессы, обеспечивающие соблюдение командами правил администрирования и обеспечения качества при работе с данными. Правильный надзор защищает от рисков, связанных с моделями ИИ, а также от других проблем.
Максимальное использование данных в эпоху ИИ
Данные уже давно являются важнейшим элементом успеха бизнеса. Но технологии ИИ нового поколения сделали использование всех преимуществ имеющихся в распоряжении организаций данных еще более важным для них.
Однако некоторые компании более подготовлены к использованию ИИ, чем остальные, потому что у одних есть более зрелые практики управления данными, чем у других. Прежде чем пытаться внедрить технологию ИИ и обнаружить, что ваша стратегия управления данными недостаточно зрелая для ее поддержки, оцените, как вы управляете своими данными, а затем выявите и устраните все недостатки — до начала внедрения ИИ.