Развитие больших языковых моделей (LLM) заставило пользователей развивать новый навык — инженерию подсказок (prompt engineering). Чтобы получить полезный ответ, люди должны были тщательно составлять свои запросы, изучая нюансы того, как ИИ интерпретирует язык. Но эта динамика может измениться. Благодаря достижениям в области обработки естественного языка (NLP) и мультимодального ИИ системы развиваются, чтобы взаимодействовать с людьми более естественно, избавляя пользователей от необходимости формировать свои запросы с максимальной точностью.
Бретт Бартон, вице-президент и руководитель глобальной ИИ-практики Unisys, рассказал об этом переходе порталу AIwire, ссылаясь на выводы из недавнего исследования Unisys «Top IT Insights for 2025: Navigating the Future of Technology and Business». В отчете подчеркивается тенденция, согласно которой ИИ обучается адаптироваться к человеку, а не человек обучается адаптироваться к ИИ. По мнению Бартона, этот сдвиг может означать упадок инженерии подсказок как критически важного навыка.
Закат инженерии подсказок?
Во многих корпоративных приложениях в различных отраслях, от промышленного производства до здравоохранения, пользователям требуется, чтобы ИИ бесперебойно функционировал в окружающей среде, особенно в непредсказуемых условиях. При этом создание длинных, подробных подсказок и ответов может оказаться невозможным.
«В производственной сфере у вас есть сотрудники, которые находятся в сумасшедшей, шумной, часто плохо освещенной среде, и они пытаются создать подсказку, которая вызовет полезный ответ, — говорит Бартон. — Мы обнаружили, что при взаимодействии с ChatGPT, Claude и т. п., если вы не даете ИИ достаточно информации, чтобы он мог конкретно соотнести подсказку и получить какие-то данные, вы оказываетесь как бы в тумане, и из этого трудно извлечь что-то ценное».
Многое зависит от способности LLM извлекать релевантную и контекстную информацию из своих обучающих данных или внешних источников. Без достаточного контекста ИИ с трудом генерирует осмысленные ответы, часто выдавая расплывчатые или неточные результаты. Инженерия подсказок сосредоточена на создании подробных и точных подсказок, позволяющих модели сопоставить запрос с существующими знаниями, извлечь релевантные детали и сгенерировать ответ, соответствующий потребностям пользователя.
Однако с развитием NLP системы ИИ становятся все более искусными в обработке неточного ввода, что позволяет пользователям вести с ИИ более естественные диалоги. Эти разработки позволяют ИИ улавливать контекст из менее структурированного пользовательского ввода, снижая нагрузку на пользователей, от которых теперь требуется формулировать свои запросы столь специфическим образом.
Как NLP и мультимодальный ИИ стимулируют эту эволюцию
По мере развития NLP его интеграция с другими модальностями ИИ позволяет создавать более интуитивно понятный пользовательский опыт. Вместо того чтобы полагаться исключительно на текстовое взаимодействие, ИИ развивают, чтобы он мог интерпретировать и реагировать на различные формы ввода, от голосовых команд до визуальных образов. По мнению Бартона, эти разработки закладывают основу для будущего, в котором взаимодействие с ИИ будет более естественным и адаптивным.
«NLP уже взаимодействует с мультимодальным ИИ и генеративным ИИ (GenAI) и играет с ними на равных, — говорит он. — Мы видим прогресс не только в компоненте распознавания речи, но и в переводе языка в режиме реального времени. Кроме того, появляются более точные камеры, ускоряется обработка данных, развивается распознавание жестов. Мы находимся на пороге появления относительно точного предиктивного ИИ, который позволит обеспечить еще более интуитивное и естественное взаимодействие с пользователем».
«Никто не расстроится из-за того, что не придется вбивать запрос», — отмечает он, добавляя, что эти улучшения позволят нам взаимодействовать с ИИ не только с помощью клавиатуры, особенно на мобильных устройствах, в автономных автомобилях и в других местах, где еще не внедрен GenAI.
По мнению Бартона, развитие NLP, которое приводит к появлению более интуитивных ИИ-приложений, также позволит повысить удовлетворенность пользователей. Это особенно актуально для отраслей, где традиционное текстовое взаимодействие нецелесообразно. Например, в здравоохранении врачи часто надиктовывают заметки, а не печатают их. Системы ИИ, использующие NLP, могут слушать, извлекать ключевые детали и запускать такие рабочие процессы, как автоматическая выписка рецептов, планирование последующих обследований и выявление потенциальных проблем со здоровьем. Цель состоит в том, чтобы ИИ работал как помощник за кадром, предугадывая потребности, а не требуя постоянных уточнений от пользователей.
Если инженеры по подсказкам исчезнут, кто займет их место?
Поскольку ИИ берет на себя все больше ответственности за эффективную коммуникацию, набор навыков, необходимых для работы с ИИ-системами, несомненно, изменится. Бартон прогнозирует рост спроса на лингвистов и других специалистов, которые смогут совершенствовать способность ИИ интерпретировать и генерировать естественный человеческий язык. «Я думаю, что придут люди из лингвистической сферы, которые помогут этим системам достичь более высокого уровня эффективности и результативности на основе устных запросов или подсказок», — говорит Бартон.
Еще один критический сдвиг произойдет в архитектуре ИИ, которая должна будет поддерживать быстрое двустороннее взаимодействие, а не более медленный процесс уточнения письменной подсказки. «Вам также придется обратить внимание на архитектуру, потому что люди могут говорить гораздо быстрее и быстрее переключаться на другой запрос, если система не выдает информацию, которую они изначально искали», — объясняет Бартон.
Для того чтобы ИИ мог идти в ногу с естественной речью и взаимодействием в режиме реального времени, потребуется сотрудничество. Архитекторы ИИ и облачных вычислений должны будут разработать масштабируемую инфраструктуру, способную справиться с возросшими потоком данных и вычислительными требованиями ИИ, управляемого голосом. Инженеры-программисты и специалисты по NLP сосредоточатся на оптимизации моделей для ускорения отклика, снижения задержки и улучшения сохранения контекста при взаимодействии.
Проблемы развертывания ИИ, управляемого голосом
По мере продвижения ИИ к голосовому взаимодействию организациям придется решать ряд проблем, включая вопросы безопасности и управления. Модели ИИ, обученные распознавать речь, должны работать в различных средах, справляясь с фоновым шумом, шифрованием и безопасной обработкой данных. Совместимость устройств также имеет значение, поскольку многие рабочие места позволяют сотрудникам использовать личные устройства, но взаимодействие на основе ИИ ставит вопросы о безопасности и владении данными.
По мере распространения голосовых взаимодействий на основе ИИ важнейшую роль в обеспечении работы этих систем в рамках правовых и этических норм будут играть механизмы регулирования и обеспечения соответствия. Такие правила, как HIPAA в здравоохранении, предъявляют строгие требования к сбору, обработке и хранению конфиденциальных данных, например медицинских карт пациентов. По словам Бартона, организациям, внедряющим голосовой ИИ, необходимо применять надежные меры безопасности, такие как шифрование и контроль доступа, чтобы предотвратить несанкционированный доступ или утечку информации.
Кроме того, компании, работающие с финансовыми или персональными данными, должны соблюдать такие нормативные акты, как GDPR, который требует прозрачности в принятии решений на основе ИИ и данных пользователей. Помимо соблюдения правовых норм, организациям также потребуется разработать внутреннюю политику регулирования для устранения предвзятости ИИ и обеспечения соответствия взаимодействия с ИИ этическим нормам.
ИИ — это развивающаяся программа, а не разовый проект
Переход к ИИ, который понимает человека, а не наоборот, представляет собой серьезный сдвиг в развитии NLP и GenAI. Поскольку эти системы становятся все более интуитивными, жесткий мир инженерии подсказок может стать пережитком прошлого.
По словам Бартона, успешное внедрение ИИ опирается на три важнейшие составляющие: качество данных, безопасность и управление организационными изменениями. Качественные, структурированные данные — это основа, поскольку системы ИИ могут быть эффективны только в той мере, в какой эффективна обрабатываемая ими информация. Организации, сталкивающиеся с проблемой низкого качества данных, часто обращаются к генеративному, а не традиционному ИИ, но новые методы, такие как стратегия диффузии, помогают очищать и проверять унаследованные данные.
Второй компонент, безопасность, гарантирует, что запросы, управляемые ИИ, будут возвращать результаты быстро и безопасно, что требует надежной инфраструктуры для обработки высокоскоростного потока данных без проблем с задержками. Наконец, решающую роль во внедрении играет управление организационными изменениями. Без надлежащего обучения и направления пользователей даже самые передовые решения на основе ИИ не смогут обеспечить окупаемость инвестиций.
«Это не проект. У него нет конца. Это программа. Как и ребенок, она требует постоянного ухода и кормления, иначе ее ценность начнет снижаться», — говорит Бартон, добавляя, что организациям не стоит отчаиваться перед предстоящими проблемами.
«Необходимо просто убедиться, что вы знаете, что нужно сделать для создания полнофункционального ИИ-приложения, которое отвечает вашим потребностям, является достаточно гибким, чтобы масштабироваться вместе с вами, а также помогает вашим сотрудникам понять, как лучше его использовать, чтобы они могли получить преимущества», — заключает он.