Yandex B2B Tech предоставила клиентам новую возможность дообучения нейросетей методом LoRA (Low-Rank Adaptation). Теперь компании смогут быстро и самостоятельно адаптировать нейросети под специализированные задачи: например, обучить модель писать письма в корпоративном стиле или извлекать важные данные из документов. Использование дообученной модели будет не дороже базовых версий нейросетей. Новый метод уже доступен всем клиентам на платформе для разработки ИИ-решений Yandex Cloud AI Studio.

Для дообучения методом LoRA уже доступны нейросеть YandexGPT и опенсорсная модель LLaMA. Вскоре это станет возможно и для моделей, которые можно запустить по запросу на выделенных мощностях — например, Qwen и DeepSeek. Таким образом бизнес сможет использовать в своих решениях несколько дообученных нейросетей, легко переключаться между ними и комбинировать их для разных сценариев.

Дообучение модели позволяет повысить качество решения конкретных задач: после кастомизации нейросети лучше суммаризируют и точнее классифицируют тексты, они точнее следуют заданному формату ответа и придерживаются определенной роли в диалоге. Качество ответов по этим задачам даже на облегченных моделях может быть выше, чем у мощных версий нейросетей. Дообучение особенно полезно, когда требования к ответу трудно сформулировать в коротком и понятном промте.

LoRА работает быстро за счет того, что изменяет небольшое количество параметров при дообучении модели. Алгоритм ориентируется на эталонные запросы и ответы, заранее заданные пользователем, и приближает результаты работы модели к образцам из датасета. При обработке небольших датасетов весь процесс дообучения с помощью LoRA может занять всего 10 минут.

«Алгоритм LoRA уже признан одним из наиболее эффективных способов дообучения, и он широко используется для кастомизации моделей среди ML-разработчиков, в том числе в Яндексе. Внедрение такого инструмента — еще один шаг к многообразию и адаптивности технологий, которые упрощают решение клиентских задач», — рассказал Григорий Атрепьев, CPO Yandex Cloud.

Дообучение моделей особенно актуально для среднего и крупного бизнеса для оптимизации наиболее частотных бизнес-задач, которые решаются с помощью нейросетей. В рамках технического тестирования LoRA уже попробовали более 100 клиентов: они использовали ее для разработки Telegram-ботов для ритейла, классификации запросов в поддержку, генерации рекламного контента и других задач. В частности, компания Presentsimple.ai использует для автоматической генерации презентаций по запросу клиента модель YandexGPT 4 Lite, дообученную с помощью LoRA на результатах работы Pro-версии. По оценке компании, таким образом стоимость генерации презентаций снизилась в шесть раз, а благодаря высокой скорости модели они смогли создавать серии объемных слайдов для клиентов за 30-40 секунд. Дообученная модель лучше придерживалась заданного технического задания по количеству символов, предложений и стилистике.