Многие компании спешат внедрить искусственный интеллект, но не могут вывести проекты за рамки этапа разработки, пишет на портале The New Stack Хароен Вермилен, соучредитель и технический директор компании Luzmo.

ИИ — это уже не будущее, а настоящее. Однако, когда компании спешат интегрировать ИИ в свои рабочие процессы, они обнаруживают, что внедрить его не так просто. Все усложняет перетягивание каната: ИИ-провайдеры, например OpenAI, Anthropic и др., хотят, чтобы предприятия перевели повседневную работу на их платформы, ориентированные на ИИ. С другой стороны, разработчики ПО стремятся внедрить ИИ в качестве функции, которая улучшит их существующие продукты и удержит пользователей.

Это противоречие подчеркивает важную истину: ИИ может стать повсеместным и приоритетным для любого достаточно крупного бизнеса, но успех не гарантирован. Недавнее исследование Bain подчеркивает этот парадокс: несмотря на всплеск активности разработчиков, в производстве находится меньше ИИ-решений, чем кварталом ранее. В то же время лидеры стаи наращивают свое преимущество. Что же является причиной этого узкого места? Внедрение ИИ в производство — сложная задача, требующая переосмысления стратегии, адаптации процессов, тщательного управления данными, обеспечения безопасности и выбора масштаба.

Новая парадигма разработки ИИ

Создание ИИ-приложений — это нахождение баланса. ИИ имеет вероятностный характер, в отличие от традиционного ПО, где входные и выходные данные предсказуемы. Это как очень умный малыш, который иногда делает то, что вы просите, а иногда решает разрисовать стены пальцами. Защитные ограждения в виде следящего процесса, который может прервать разговор, — это ваш способ удержать систему от ошибок и неприятностей.

Эта непредсказуемость также меняет наше представление о проектировании ИИ-приложений. Вносить итеративные изменения в системы ИИ очень сложно, поскольку общая точность может легко откатиться назад. Чтобы избежать этого, необходимо заранее продумать, с чем вы хотите, чтобы справлялась большая языковая модель (LLM), а с чем вы хотите справиться сами. Речь идет не только о модели, но и обо всей системе и сценарии использования.

Думайте достаточно масштабно, чтобы оказать реальное влияние, и заблаговременно заручитесь поддержкой руководства. Даже самые лучшие идеи могут заглохнуть без него еще до того, как они покинут стартовую площадку.

Создание основы

Отправной точкой для любой интеграции ИИ является выбор базовой модели. К счастью, большинство моделей совместимы с API, что позволяет легко менять их в зависимости от ваших потребностей. Будь то GPT-4o или -o1, Claude, Gemini или иное, каждый поставщик предлагает свои модели разного уровня сложности и стоимости. Модели Llama предлагаются, например, как «open-weights», с общедоступными параметрами (весами), которые можно использовать и модифицировать без ограничений; вы можете загружать и запускать их на своем собственном (достаточно мощном) оборудовании.

Такая взаимозаменяемость означает, что реальные отличия кроются в другом: в том, как вы интегрируете данные своей компании, создаете защитные ограждения и адаптируете процессы разработки.

Время привлекать данные своей компании

Истинная сила ИИ заключается в его способности работать с данными вашей компании. Существует две основные стратегии для достижения этой цели: тонкая настройка и векторные вложения. Тонкая настройка — это что-то вроде абонемента в спортзал для ИИ: все говорят о ней, но лишь немногие действительно ее используют. Она требует значительных ресурсов, опыта и постоянного обслуживания, что делает ее непрактичной для многих компаний.

Вместо этого в большинстве успешных реализаций используются векторные вложения. Документы или текст предварительно преобразуются в векторы, которые подобны координатам на карте, указывающим на значение слов. Вместо того чтобы ограничиваться долготой и широтой, координаты состоят из тысяч измерений. Элементы, расположенные близко друг к другу, имеют схожее значение.

Большие документы содержат множество мыслей и смыслов, которые необходимо разбить на фрагменты, достаточно маленькие для эффективного запроса, но не настолько маленькие, чтобы потерять контекст. Можно использовать различные стратегии разбиения, включая подходы со скользящим окном и перекрывающимися фрагментами. Существует множество способов выбрать, какие фрагменты являются релевантными для разговора и передаются ИИ для анализа.

Масштабирование векторной базы данных и поддержание ее в актуальном состоянии по мере роста бизнес-данных — сложные задачи. Чтобы добиться максимальной отдачи от инвестиций в ИИ, обратитесь к специализированным ИТ-поставщикам, которые предлагают такие услуги.

ИИ в производстве: это стоит усилий

В основе успешной интеграции ИИ лежит надежный план управления данными. Первым шагом является фиксация всех взаимодействий с ИИ, включая разговоры и скрытую или явную обратную связь. Этот непрерывный поток данных обеспечивает исходный материал для создания обучающих наборов данных и улучшения производительности с течением времени. Мониторинг ИИ после запуска в производство не менее важен. Отслеживание результатов в режиме реального времени гарантирует, что система ведет себя так, как задумано, выявляет аномалии и предоставляет возможности для принятия корректирующих мер. В совокупности эти методы составляют основу адаптивной и устойчивой ИИ-стратегии.

Внедрить ИИ в производство сложно, но оно того стоит. Основополагающие модели могут быть у всех на слуху, но настоящее волшебство заключается в том, как компании используют свои данные, разрабатывают безопасные и этичные системы и адаптируют рабочие процессы к уникальным ИИ-требованиям.

При тщательном планировании и исполнении ИИ сможет преодолеть шумиху и стать той преобразующей силой, которой он должен быть.