Мэтью Хойссер, управляющий консультант Excelon Development, обсуждает на портале TechBeacon, что представляет собой модный ныне чатбот ChatGPT и каковы его перспективы.
30 ноября 2022 г. компания OpenAI выпустила чатбот под названием ChatGPT. Сочетая разговорный ИИ с генеративным ИИ, ChatGPT может общаться, создавать творческий и/или функциональный контент, решать математические задачи, давать советы, играть в игры и даже писать код.
Неудивительно, что он пользуется популярностью. Когда ChatGPT стал первоначально доступен бесплатно (с регистрацией), он привлек миллион пользователей за пять дней. Для сравнения, чтобы достичь того же рубежа, Instagram (соцсеть, признанная в России экстремистской) потребовалось два с половиной месяца, а Twitter (заблокирована в России) — два года.
Но в какой степени это настоящий искусственный интеллект? ChatGPT, похоже, не проявляет признаков сознания (пока) — но ученые еще не очень понимают, что такое сознание и как оно зарождается. В любом случае, ПО с генеративным ИИ, такое как ChatGPT, похоже, немаловажно для продолжающихся инноваций в области ИИ. Прежде чем подходить к этому вопросу философски, мы должны взглянуть на него с поведенческой точки зрения.
Тест Тьюринга
Алан Тьюринг, британский ученый-компьютерщик, который помог взломать немецкий код Enigma во время Второй мировой войны, разработал простой поведенческий тест для ИИ. Тест Тьюринга включает в себя интерактивный интерфейс, похожий на чат; согласно Тьюрингу, если со временем, основываясь на полученных ответах, вы не сможете определить, с кем вы разговариваете — с человеком или машиной, значит перед вами ИИ.
Для этого ПО должно общаться на разговорном языке, понимать общие идиомы, улавливать сарказм, преобразовывать слова в символы (и наоборот) и обучаться. ИИ, определенный таким образом, должен уметь, скажем, решить устную математическую задачу на уровне 11 класса, и даже попросить о помощи, если он застрял.
ChatGPT — не первый ИИ, который пытается делать что-то подобное. В 1966 г. Джозеф Вейценбаум разработал компьютерную программу разговорного ИИ под названием ELIZA. Она могла распознавать определенные ключевые слова и формы речи. Вейценбаум включил в нее элементы роджерианской психотерапии, согласно которой терапевт ждет, пока пациент заговорит, а затем задает простые вопросы (например, «Что вы об этом думаете?»). Если ELIZA не могла точно распознать, что набирает пользователь, она могла по умолчанию использовать роджерианские ответы.
Реализованная на полудюжине страниц на языке BASIC, Eliza легко переносится на другие платформы программирования, включая JavaScript и HTML. Существуют бесплатные версии Eliza, с которыми вы можете поэкспериментировать и сегодня. «Обмануть» программу и понять, что это робот, было достаточно легко — в основном из-за слов, которые имеют разные значения в разных контекстах. Из-за этого Eliza не могла разговаривать. Кроме того, она не могла обучаться.
Второй популярной реализацией ИИ является 20Q — компьютеризированная игра в 20 вопросов, разработанная в 1988 г. Игра начинается с того, что компьютер спрашивает, является ли предмет, о котором думает пользователь, животным, овощем или минералом; затем он переходит к вопросам «да-нет». Хотя 20Q не прошла бы тест Тьюринга, эта игра может в некотором роде обучаться. 20Q создает дерево решений на основе ответов, которые пользователи дают в совокупности. Это дерево решений растет по мере прохождения игры. Если игроки отвечают честно, 20Q со временем становится все более точной. Как и ELIZA, 20Q доступна онлайн бесплатно.
ChatGPT объединяет способность 20Q к обучению с чат-интерфейсом ELIZA и добавляет разговорную речь, идиомы, сарказм и многое другое. ChatGPT опирается на предварительное сканирование значительной части Интернета для завершения предложений. Если наши телефоны и поисковые системы могут предлагать слова, то ChatGPT заходит так далеко, что может предложить следующий абзац.
Осмысление ChatGPT
Академические ученые используют для описания уровней мастерства таксономию Блума. В ней самый низкий уровень пирамиды иерархии учебных целей — это запоминание, то есть знание слов. Выше идет понимание, а затем применение.
Поисковик Google — пример запоминания; вы задаете ему ключевое слово, и он его находит. Программисты, которые еще не освоили свой предмет, часто используют «разработку под руководством Google», ища, как решить проблему кодирования. Воспользовавшись StackOverflow, Medium, форумами поддержки и всем, что может выдать поисковая система, программисты часто могут понять, как сделать что-то простое. Поскольку ChatGPT обучен на подмножестве Интернета и общается в разговорной форме, он, кажется, способен выполнить этот поиск за вас и дать вам наводку, как сделать что-то.
Представьте себе наивного и ленивого первокурсника колледжа, который, вероятно, способен предоставить эссе, погуглив и обобщив что-то (возможно, с некоторой степенью настойчивости). Это эссе может показаться убедительным для неспециалиста, но не выдержит тщательной проверки. Аналогично — в контексте кодирования — спрашивающий может еще не обладать достаточными знаниями, чтобы спросить о конкретной версии инструмента и языка программирования, а ChatGPT, в свою очередь, стремится интегрировать советы из полудюжины версий одного и того же Open Source-проекта.
Тем не менее, самой мощной частью ChatGPT может быть его способность учиться — принимать обратную связь и меняться. Это означает, что со временем, как и в игре 20Q, его ошибки могут быть исправлены.
Сегодня мы имеем инструмент, который может генерировать скелетный код практически на любом языке программирования и генерировать пробный код, который может даже работать, он также может обобщать правовые аргументы на выбранном уровне. Это демонстрирует, по крайней мере, уровень понимания по таксономии Блума. При правильных исходных данных можно было бы обучить ChatGPT применять эти идеи. Например, Джейсон Перлоу взял четыре часа стенограмм с технологической выставки и попросил ChatGPT обобщить полученные результаты. Результаты не ужасны, но они поверхностны.
В настоящее время такой генеративный ИИ кажется сродни ассистенту профессора, который не разбирается в предметной области, но может делать нехитрый поиск в Google. Похоже, что обучение инструмента правильному пониманию предмета с первого раза все еще потребует заметных усилий. Но что произойдет после того, как ChatGPT будет обучен понимать конкретные предметные области? Мне, например, не терпится это узнать.