Малые языковые модели (Small Language Models, SLM) предлагают, по сравнению с широкопрофильными большими языковыми моделями (Large Language Models, LLM), экономически эффективные решения, ориентированные на конкретную область, пишет на портале The New Stack Сувик Дас, директор по продуктам и технологиям компании Clearwater Analytics.
В условиях, когда генеративный ИИ (GenAI) продолжает с бешеной скоростью трансформировать операции и процессы, организации переживают переломный момент. Майский отчет McKinsey показал, что 65% респондентов регулярно используют GenAI как минимум в одной бизнес-функции — почти вдвое больше, чем за десять месяцев до этого.
Однако в то время как одни компании уже пожинают плоды GenAI, другие сталкиваются со сложностью внедрения, поскольку правила еще только пишутся. В условиях «Дикого Запада» задача очевидна: поскольку GenAI способен ускорить работу людей во всех отраслях, руководители компаний должны решить, как эффективно использовать его потенциал.
Согласно результатам майского исследования IBM, 62% руководителей компаний готовы идти на больший риск при внедрении ИИ, чем их конкуренты, при этом половина (51%) призналась, что страх отстать заставляет их инвестировать в некоторые технологии еще до того, как они получат четкое представление об их ценности. Учитывая этот контекст, компании сталкиваются с необходимостью принимать множество решений о том, как лучше внедрить и ввести в действие GenAI — от выбора правильных поставщиков инфраструктуры и моделей до управления организационными изменениями в своих организациях.
Ниже приведен ряд советов, которые помогут руководителям принять важные решения о наиболее эффективном использовании инвестиций в GenAI в этой быстро меняющейся обстановке.
Тенденции внедрения генеративного ИИ
После выделения бюджета технические директора и разработчики приложений должны рассмотреть множество доступных поставщиков GenAI. Лица, принимающие решения, должны оценить преимущества и риски каждой модели или инфраструктуры, а также ценовые характеристики, поскольку инструменты GenAI/LLM могут иметь значительные различия. Кроме того, такие гиганты индустрии, как Google и Amazon, постоянно обновляют и модернизируют свои модели. Каждая модель имеет свои сильные стороны, возможности и специализацию, они также различаются по уровню масштабируемости и настраиваемости. Компании из разных отраслей имеют уникальные потребности, а различные отделы внутри компаний — специфические требования.
Исследование Gartner показало, что применение GenAI, встроенного в существующие приложения (например, Copilot for 365 от Microsoft или Adobe Firefly), является основным методом реализации сценариев использования GenAI. Далее следуют кастомизация моделей GenAI с помощью инжиниринга подсказок (25%), обучение или тонкая настройка моделей GenAI, созданных на заказ (21%), или использование отдельных инструментов GenAI, таких как ChatGPT или Gemini (19%). Но как разобраться с выбором, например, модели от OpenAI или Anthropic либо Llama с открытым исходным кодом?
Оценка моделей генеративного ИИ для использования в бизнесе
Мы рекомендуем двигаться методично — но не настолько методично, чтобы вас парализовало. Команда по оценке моделей на предприятии или отдельный человек в небольшой организации должны изучить, какие модели лучше оптимизированы для конкретных приложений и запросов. В идеале команда должна получить практическое представление об эффективности и результативности различных моделей. Она также должна предвидеть ошибки и быть готовой продолжать опробовать разные модели после первичных испытаний, поскольку модели GenAI продолжают совершенствоваться.
Насколько необходима инженерия подсказок?
При выборе подхода к интеграции инструментов GenAI руководители должны учитывать, сколько времени и ресурсов им придется выделить на обучение своих моделей. Предварительно обученные модели, разработанные для решения задач общего назначения, требуют минимальной инженерии подсказок. Организации, работающие в высокорегулируемых отраслях, таких как финансовый сектор, энергетика или здравоохранение, обнаружат, что их сценарии использования требуют значительной инженерии подсказок для создания защитных ограждений для своих моделей. Тем, кто занимается созданием контента, маркетингом и обслуживанием клиентов, потребуется более легкое обучение, чтобы ответы были профессиональными, непредвзятыми и соответствовали стратегии брендинга. Компании, занимающиеся финансовыми услугами или здравоохранением, должны убедиться, что технология работает в соответствии с их сценариями использования и потребностями клиентов.
Большинству компаний потребуется хотя бы некоторый уровень инженерии подсказок, чтобы точно настроить инструмент под свои задачи. Проще говоря, чем лучше вы обучите GenAI, тем лучше будут результаты. Вполне возможно, что большинство отраслей предпочтут использовать не готовые решения, а модели, созданные на заказ с учетом их потребностей. Уже сейчас, согласно McKinsey, основная (60% респондентов) стратегия энергетических компаний при разработке GenAI заключается в создании собственных моделей или их значительной адаптации. В сфере финансовых услуг и здравоохранения так же поступают 47%.
Баланс между экспертными знаниями и ИИ-технологиями
По нашему опыту работы с глобальными финансовыми учреждениями, важно тщательно разрабатывать подсказки, чтобы обеспечить понимание гранулированного контекста запросов. Выделенные аналитики по подсказкам неоценимы на этом этапе для компаний, пытающихся использовать сложные сценарии использования в таких секторах, как финансы, технологии или энергетика. Эти аналитики оценивают ответы моделей и дорабатывают подсказки, чтобы они приводили к нужным результатам. Человеческий контроль по-прежнему играет важную роль при внедрении инструментов ИИ.
Наш опыт показывает: чтобы в полной мере извлечь пользу из GenAI-агентов, компании должны постоянно создавать все больше сценариев использования для своих операций и клиентов. В наших первых экспериментах с многоагентными рабочими процессами агенты работали медленно и недостаточно эффективно, и их пришлось дорабатывать. Мы обнаружили, что чем шире сфера применения, тем более проблематичными оказываются эти агенты.
Преимущества SLM
Если сузить область применения моделей, они станут более отзывчивыми и компетентными в ответах на конкретные вопросы. Например, если я создаю рабочий процесс GenAI для управления инвестициями или клиентский сценарий использования, мне не нужно 90% того, чему обучены LLM. Мне нужны более узкопрофильные агенты, которые глубоко понимают область, актуальную для инвестиционных менеджеров. Для их создания нужен ИИ-специалист с опытом работы в сфере финансовых услуг. Самые главные причины растущего распространения SLM — доступность и экономия ресурсов.
Для высоконастроенных LLM требуются миллиарды параметров, и они настолько массивны, что в Интернете уже не хватает данных. Удивительно, правда? Обучение этих LLM требует много времени и значительных затрат энергии, о чем свидетельствуют реанимация Microsoft печально известной атомной электростанции Three Mile Island и стремительный рост капитализации Nvidia и рыночной доли ее графических процессоров. Большинство компаний не могут позволить себе огромные инвестиции в инфраструктуру, необходимую для таких моделей. Именно поэтому венчурные капиталисты финансируют разработчиков SLM, пример, Arcee, которая недавно получила 24 млн. долл. в рамках серии А.
Интеграция синтетических и курируемых данных для SLM
Несмотря на то что SLM обучаются на гораздо меньшем количестве данных, их поставщики также сталкиваются с трудностями, поскольку модели хороши лишь настолько, насколько хороши их базовые наборы данных. Поэтому поставщики тратят много времени на то, чтобы определить, какие наборы данных использовать для обучения. Однако стартапы приходят на помощь и создают узконаправленные синтетические наборы данных, на которых компании могут обучать модели с высокой точностью для своих уникальных нужд.
Ряд компаний разрабатывает инструменты для всех уровней стека GenAI, чтобы повысить его эффективность и производительность. Это еще раз подтверждает мысль о том, что организациям следует сохранять гибкость и не слишком полагаться на какого-то конкретного поставщика языковых моделей, будь то ChatGPT, Claude или Anthropic. Каждый поставщик моделей будет развиваться самостоятельно, поэтому важно, чтобы ваша инфраструктура позволяла легко менять модели по мере необходимости.
Обеспечение гибкости при внедрении GenAI
Для организаций настало время принять бум генеративного ИИ. Активно внедряя эту преобразующую технологию и сохраняя бдительность в отношении потенциальных подводных камней, компании смогут эффективно преодолевать сложности внедрения ИИ.
Начните с малого, опробуйте разные сценарии использования, внедрите культуру итераций и обучения — путь к максимальному раскрытию потенциала GenAI только начинается и разворачивается на наших глазах.