Искусственный интеллект, ориентированный на данные, поможет уменьшить количество галлюцинаций и предубеждений, а также повысить качество выводов в системах генеративного ИИ, пишет на портале The New Stack Рахул Прадхан, вице-президент по продуктам и стратегии компании Couchbase.

Достижения в области трансформерных нейронных сетей и генеративного ИИ являются движущей силой одного из крупнейших технологических сдвигов современности. Они также способны раскрыть инновации и изобретательность в масштабе.

По мере развития ИИ данные занимают все более главенствующее положение. Это жизненная сила, которая питает проекты машинного обучения, превращая простые понятия в действенные инсайты. Однако путь к эффективному использованию данных в ИИ-проектах сопряжен с проблемами, которые могут помешать внедрению и достижению преобразующей ценности.

Чтобы укрепить развитие ИИ, требуется смена парадигмы — переход от подхода к ИИ, ориентированного на модели, к подходу, ориентированному на данные. Этот сдвиг может существенно помочь уменьшить количество галлюцинаций и предубеждений в системах генеративного ИИ. Сосредоточение внимания на ИИ, ориентированном на данные, и приближение моделей к данным улучшит производительность моделей ИИ и позволит предприятиям полностью раскрыть их потенциал.

Моделе-центричный подход к ИИ

Ориентированный на модели подход к ИИ — это традиционный путь развития МО. Он предполагает итерации для улучшения производительности модели, направленные на создание лучшей модели для заданного набора данных. Исследователи и инженеры тратят значительное время на тонкую настройку параметров модели, слоев и других архитектурных элементов. При этом набор данных часто рассматривается как второстепенный, поскольку исторически построение и тонкая настройка моделей были сложными и ресурсоемкими, требующими глубоких знаний и опыта для получения значимых результатов.

Переход к дата-центричному ИИ

В отличие от этого, подход, ориентированный на данные, повышает качество данных, на которых обучается модель. Он включает в себя очистку данных, их расширение и обеспечение репрезентативности данных для реальных сценариев, в которых будет применяться модель.

По мере развития, диверсификации и усложнения моделей ИИ организациям следует работать над повышением качества данных и созданием более тесного союза между моделями и данными. В этой развивающейся истории необходим и понятен сдвиг: приблизить модели к данным, а не данные к моделям. В результате повышается качество выводов модели и уменьшается количество галлюцинаций, которые часто мучают системы ИИ. Такой подход к ИИ, ориентированный на данные, является краеугольным камнем для организаций, которые хотят обеспечить генеративный и предиктивный опыт, основанный на самых свежих данных.

Хотя ИИ, ориентированный на данные, — это путь вперед, ИИ, ориентированный на модели, по-прежнему играет важную роль. Он особенно важен в сценариях, когда данные ограничены или целью является исследование пределов сложности и производительности модели. Он важен для расширения границ исследований в области ИИ и для решений, где высококачественные данные могут быть недоступны.

Переосмысление ИИ с помощью дата-центричности

Переход к подходу к ИИ, ориентированному на данные и обеспечивающему их качество и актуальность, может принести организациям следующие преимущества:

  • Наведение мостов с реальностью благодаря улучшенному качеству данных. Одним из основных преимуществ подхода, ориентированного на данные, является возможность предоставления опыта, тесно связанного с реальными сценариями. В отличие от подхода, ориентированного на модели, при котором модели часто сталкиваются с ошибками, связанными с низким качеством данных, ИИ, ориентированный на данные, стремится преодолеть пропасть между моделями ИИ и динамичными реалиями, на которые они стремятся ориентироваться.
  • Избавление от галлюцинаций. Галлюцинации ИИ, характеризующиеся генерированием неверной или сфабрикованной информации, — это прежде всего симптом некачественных данных. Переход к подходу, ориентированному на данные, повышает вероятность уменьшения количества таких ошибок. Обучение моделей на более чистых и репрезентативных наборах данных приводит к получению более точных и надежных результатов.
  • Раскрытие полного потенциала предиктивного и генеративного ИИ. Имея прочный фундамент высококачественных данных, организации могут раскрыть весь спектр предиктивных и генеративных возможностей ИИ. Благодаря этому сдвигу ИИ становится более способным интерпретировать существующие модели данных, а также генерировать новые идеи и опыт, способствуя развитию культуры инноваций и принятия обоснованных решений.

Путь в будущее: данные в авангарде эволюции ИИ

Переход от подхода к ИИ, ориентированного на модели, к подходу, ориентированному на данные, представляет собой фундаментальный сдвиг в мышлении. Речь идет о том, чтобы поставить данные в центр трансформационного пути ИИ. Этот переход — нечто большее, чем простая техническая корректировка; это концептуальная перестройка, которая ставит данные в центр ИИ. Вступая на этот путь, организации должны создавать надежную инфраструктуру данных, воспитывать грамотность в работе с данными и формировать культуру, которая видит в данных основополагающий краеугольный камень перспектив ИИ.

Использование лучшего из двух миров

Создание надежных решений в области ИИ требует тонкого понимания того, когда следует делать упор на данные, а когда — на инновационные модели. Сбалансированный подход, использующий сильные стороны как ориентированного на модели, так и ориентированного на данные ИИ, необходим для решения современных задач ИИ, чтобы организации могли получить максимальную отдачу от своих ИИ-проектов. Чтобы модели ИИ разрабатывались на основе самых свежих данных, были точными и надежными, организации должны принять переход к ИИ, ориентированному на данные.