Организациям следует уделить время и ресурсы технологиям искусственного интеллекта и векторных баз данных, пишет на портале The New Stack Андре Заярни, соучредитель и генеральный директор Qdrant, разработчика опенсорсной векторной базы данных и движка поиска по сходству.

Рост векторных баз данных не подает признаков замедления: по прогнозам Forrester, большинство организаций будут их использовать в производстве к 2026 г. Однако векторные базы данных и связанные с ними проблемы будут сильно меняться, особенно при масштабном использовании. Сегодня это особенно заметно по той роли, которую векторные базы данных играют в корпоративном внедрении агентов ИИ.

Векторные базы данных станут ключом к созданию агентов ИИ — «следующего рубежа генеративного ИИ», по мнению McKinsey. «Мы начинаем эволюцию от инструментов, основанных на знаниях, которые работают на базе генеративного ИИ (GenAI) — скажем, чат-ботов, отвечающих на вопросы и генерирующих контент, — к агентам на базе GenAI, которые используют базовые модели для выполнения сложных, многоэтапных рабочих процессов в цифровом мире. Одним словом, технология переходит от мыслей к действиям», — отмечает консалтинговая компания.

По прогнозам Deloitte, в 2025 г. агентов ИИ, использующих GenAI, развернут 25% предприятий, а к 2027 г. их доля возрастет до 50%. «Несмотря на то, что первопроходцы будут бороться со сложностями и проблемами, видение достаточно убедительно, чтобы организации предприняли проактивные шаги по подготовке к внедрению, — говорится в отчете консалтинговой компании. — Эта эволюция позволит агентам ИИ решать все более широкий круг задач, предоставляя компаниям ценные инструменты для повышения производительности труда работников сферы знаний и эффективности всех видов рабочих процессов».

Агентный ИИ — это работа для нативных векторных баз данных

Хотя традиционные базы данных могут поддерживать приложения ИИ, им не хватает специализированной архитектуры для эффективной обработки огромных объемов мультимодальных, неструктурированных данных — в частности, в режиме реального времени. Нативные векторные базы данных идеально подходят для получения релевантных и учитывающих контекст ответов, которые требуются агентному ИИ.

Например, во многих традиционных приложениях пользователи отправляют запрос и получают ответ на основе конечных и структурированных данных. Агенты совсем другие — они принимают решения на основе различных входных данных на многих этапах, используя различные типы данных. Например, в здравоохранении агент ИИ может обобщать последние рентгеновские снимки, врачебные записи, результаты лабораторных исследований, научные работы и многое другое, чтобы выступать в качестве помощника в клинических условиях, работая на уровне человеческого понимания и корректируя рекомендации по мере изменения данных. В туристической отрасли агент ИИ может разрабатывать персонализированные маршруты, используя данные из социальных сетей, фотографии, видео, путеводители, новостные ленты и прогнозы погоды в режиме реального времени.

Возможности безграничны, но общим фактором успеха любого ИИ-агента является доверие. Векторные базы данных выступают в качестве памяти для этих агентов, обеспечивая адаптивное обучение, принятие решений в режиме реального времени, сотрудничество между агентами и контекстную точность.

Еще пример: компания QA.tech, предоставляющая решения для автоматизированного тестирования на основе ИИ, использует векторную базу данных для создания агентов тестирования, которые выполняют задачи в браузере так же, как это делает пользователь. Эти агенты заменяют жестко закодированные тесты, которые сложно настраивать и поддерживать с течением времени, и избавляют от необходимости нанимать QA-тестеров-людей. Агенты документируют ошибки и отмечают их для просмотра разработчиками. Поскольку весь процесс тестирования записывается, разработчики могут быстро проанализировать каждый шаг, чтобы выявить проблемы и недостатки.

Требования QA.tech — в первую очередь, эффективная работа в режиме реального времени и масштабируемая инфраструктура — отражают потребности большинства корпоративных приложений. По мере того как предприятия будут внедрять и расширять использование агентов ИИ, а сами агенты будут создаваться для все более сложных задач, необходимо будет учитывать, как и насколько хорошо векторная база данных справляется с сетевыми нагрузками и нагрузкой на процессор, а также ее способность хранить несколько вложений для различных сценариев использования.

Проблемы расширения применения векторных баз данных

Хотя векторные базы данных обладают огромным потенциалом для предприятий, стремящихся внедрить агентный ИИ, они также создают определенные проблемы.

Например, по мере расширения использования агентных приложений будут расти опасения по поводу утечек данных, суверенитета данных и соблюдения нормативных требований. Open Source-системы, контроль доступа на основе ролей, шифрование и возможность гибкого развертывания баз данных онпремис, в дата-центрах и/или в облаке — вот лишь некоторые из инструментов, которые могут использовать организации для того, чтобы векторные базы данных не стали слабым звеном в цепочке приложений ИИ. Стоимость и емкость также будут актуальны в условиях масштабирования векторных баз данных, что является еще одной причиной для рассмотрения открытых решений, предоставляющих возможности гибридного развертывания.

Другой проблемой является наличие специалистов. Многие компании не обладают достаточным опытом, чтобы запустить векторные базы данных, не говоря уже о полной оптимизации технологии агентного ИИ в корпоративной среде. Справедливости ради следует отметить, что это не столько проблема векторных баз данных, сколько проблема ИИ — эта технология быстро развивается, как и сценарии ее использования, и угнаться за ней бывает непросто. Агентный ИИ, например, еще полгода назад мог не попадать на радары предприятий, но сейчас для многих компаний он является важнейшим конкурентным требованием.

Организациям следует выделить время и ресурсы специально для технологий ИИ и векторных баз данных. В то же время они также могут ликвидировать пробел в навыках, сосредоточившись на использовании Open Source во всем ИИ-стеке. Организации, использующие решения с открытым исходным кодом, получают выгоду от коллективных знаний и опыта сообщества, а также избегают проблем, связанных с использованием ИИ-продуктов, которым не хватает прозрачности.

Если 2024-й стал годом, когда организации обнаружили взаимосвязанность векторных баз данных и GenAI, то 2025-й и последующие годы станут эпохой, когда векторные базы данных станут движущей силой инноваций в области GenAI, включая агентный ИИ.