В последние годы технология обработки естественного языка (natural language processing, NLP) совершила качественный скачок в плане точности, скорости и методологии. Сегодня это одна из наиболее быстроразвивающихся областей искусственного интеллекта. Диллон Эрб, соучредитель и генеральный директор Paperspace, обсуждает на портале eWeek пять важных NLP-тенденций, которые повлияют на предприятие в 2021 г.
NLP быстро набирает популярность на предприятиях. Большое количество компаний внедряют решения для текстовой аналитики, системы распознавания речи, чатботы и другие варианты языковой обработки. Неудивительно, что за последние три года эта технология стала одной из доминирующих областей науки о данных. NLP также является зонтичным термином для родственных технологий, таких как понимание естественного языка (natural language understanding, NLU), генерация естественного языка (natural language generation, NLG) и взаимодействие на естественном языке (natural language interaction, NLI).
1. NLU еще предстоит пройти долгий путь
Человеческий язык сложен. В конце концов, язык — выразитель человеческой мысли. В этом контексте NLU связывают с одной из самых сложных ИИ-проблем — создания «сильного ИИ», а потому ее «решение» позволит подобрать ключ к универсальному ИИ. Но как зонтичная ИИ-технология NLU привлекает много внимания, потому что открывает множество увлекательных сценариев применения. Ее значимость состоит в том, что являясь частью других технологий, она помогает им раскрыть реальную ценность. Таким образом, хотя NLU еще далека от коммерческого применения, она уже зарекомендовала себя как перспективная для предприятий. NLU используется для анализа настроений клиентов, которые обращаются с запросами о помощи в техподдержку или для понимания вопросов, задаваемых цифровым голосовым помощникам типа Siri и Alexa. Он также переводит текст между языковыми парами в многоязычных сервисах нейронного машинного перевода, таких как Google Translate. NLU окружает нас повсюду, но прежде чем в сети появится полностью универсальный интеллект, пройдут годы.
2. Модели быстро улучшаются
Возможно, самая известная модель ИИ в мире на данный момент — это алгоритм обработки естественного языка GPT (Generative Pre-trained Transformer) некоммерческой исследовательской организации OpenAI. Последняя версия GPT-3 была выпущена в начале года спустя 18 месяцев после выхода GPT-2 и представляет собой самую сложную языковую модель. Среди других подобных алгоритмов ее выделяет «натренированность»: система обучена на 1,5 трлн. слов, а ее самая крупная версия занимает около 700 Гб. GPT-3 генерирует текст на основе 175 млрд. параметров — их стало на два порядка больше. Выпуски GPT мгновенно привлекают внимание СМИ во всем мире из-за генерации фейковых новостей, процедурального (генеративного) искусства, базового кода, который пишет сам себя и многого другого.
Развитие языковых моделей, таких как GPT, вдохновляет на создание множества новых подходов и приложений для машинного интеллекта на предприятии — от возможности писать веб-приложения с описанием на человеческом языке до имитации языковых моделей общественных деятелей и обучения на базе медицинской литературы для постановки диагнозов.
3. Успешными оказываются узкие сценарии использования
Машинным обучением (МО) и глубоким обучением, особенно на корпоративном уровне, занимаются сотни тысяч людей. Для этих целей задействуются графические процессоры (GPU). Общим для МО-проектов является их узкая направленность, но именно она приносит выгоды бизнесу. Многие ИИ-проекты, такие как GPT-3 привлекают значительное внимание СМИ из-за вдохновляющего видения будущего, открываемого этими технологиями. В то же время корпоративные проекты, которые приносят практическую пользу уже сегодня, имеют узкую направленность, требуют целевого развертывания и приносят очень специфическую ценность для бизнеса.
Автоматический выбор объекта на фоновом изображении в Adobe Photoshop — пример узкоспециализированного применения компьютерного зрения, которое приносит реальную пользу. Пользователям Photoshop не нужно тратить часы на создание фонов с кропотливой точностью до пикселя.
4. Обслуживание модели
В отличие от традиционного ПО, производственные модели МО требуют обслуживания, поскольку со временем их производительность может снижаться. Этот факт в сочетании со сложной структурой (модель состоит из кода, данных, вычислений и показателей производительности) привел к буму инструментов CI/CD и MLOps, а также продуктов для абстрагирования от инфраструктуры. Одна из самых интересных особенностей NLU или NLP (или на самом деле любого другого приложения МО) заключается в том, что со временем модель можно улучшать. Номинальное повышение точности модели на несколько процентных пунктов во многих сценариях применения может принести прибыль в миллионы долларов для основного бизнеса. Конкретные примеры включают такие приложения, как механизмы рекомендаций, приложения финансового моделирования и др. Чтобы они продолжали приносить пользу, важно обладать системами предсказуемого развертывания.
5. Отношение к МО как программной дисциплине
Наиболее перспективный способ подготовки предприятия к извлечению ценности из МО — это превратить его в программную дисциплину для бизнеса. Подавляющее большинство проектов МО не приносят практической пользы из-за того, что исследовательские эксперименты не выходят за переделы ноутбуков разработчиков или специалистов по обработке данных. Чтобы этого не происходило, важно определить приоритеты систем, которые помогут вашей компании развертывать модели в производстве и приносить пользу.
Отношение к МО как к программной дисциплине означает наличие налаженного конвейера для перевода исследовательских проектов в производство. Другими словами, ему должно уделяться такое же внимание и выделяться такие же ресурсы DevOps, как и остальному программному стеку. Это также означает управление версиями кода, данных и самих моделей МО. Помимо этого крайне важно упростить предоставление инфраструктуры, чтобы любой сотрудник организации имел возможность развернуть модель в любом масштабе.
Конечная цель — сделать ИИ сильной стороной организации. В сфере МО имеет смысл настроить мощные процессы, чтобы они позволяли как можно скорее получить выгоды. Самые прибыльные модели со временем становятся еще более прибыльными, поэтому важно начать сейчас.