Андрей Карпатый, соучредитель OpenAI и бывший старший директор по ИИ в Tesla, рассказал на недавней конференции стартапов в Сан-Франциско о современных трендах в разработке ПО и о новой эре Software 3.0, сообщает портал ZDNet.
Являются ли большие языковые модели (LLM) нашими новыми операционными системами? Если да, то они меняют определение того, что мы считаем программным обеспечением.
Для описания влияния быстро развивающихся технологий искусственного интеллекта используется несколько аналогий, таких как коммунальные вычисления, системы разделения времени и операционные системы. Карпатый считает, что ОС — это наиболее подходящая аналогия. В этом сценарии LLM — это, по сути, новые виды компьютеров, которые организуют работу памяти и вычислений для решения задач.
LLM — это сложные программные экосистемы, объясняет Карпатый. Существует множество параллелей между этими экосистемами и ОС прошлых лет. Показательно, что в
По его словам, аналогии с коммунальными вычислениями и вычислениями с разделением времени также применимы к LLM, поскольку они повсеместно распространены, а их создание требует больших капиталовложений. «Мы находимся как бы в эпохе
Высокие стоимость и сложность означают, что в некотором смысле «революция персональных вычислений» с LLM еще не произошла, поскольку «это просто неэкономично и не имеет смысла», — добавляет он.
В отличие от современных ОС, для LLM не разработан общий графический интерфейс пользователя (GUI). «Всякий раз, когда я общаюсь с ChatGPT или какой-нибудь LLM напрямую в текстовом режиме, у меня возникает ощущение, что я разговариваю с ОС через терминал, — говорит Карпатый. — Должен ли у ChatGPT быть графический интерфейс, отличный от простого текстового? Конечно, у некоторых приложений есть GUI, но его нет для всех задач. GUI еще не изобретен в общем виде».
Однако, несмотря на эти проблемы, прогресс идет быстрыми темпами. Карпатый предполагает, что мы вступаем в эру «Software 3.0». В то время как разработка программ в эру Software 1.0 предполагала кодирование в системе, а Software 2.0 основывалась на нейронных сетях, в Software 3.0 используются подсказки «на нашем родном естественном языке».
Карпатый считает, что его предыдущий опыт работы над технологией автопилота Tesla иллюстрирует переход от Software 1.0 к 2.0 и 3.0. По его словам, он затронул стек ПО для рулевого управления и управления акселератором.
«В свое время в автопилоте была тонна кода на C++, который был кодом Software 1.0, также в некоторой степени использовалась нейронная сеть для распознавания образов. По мере совершенствования автопилота возможности и размеры нейронной сети росли, а весь код на C++ заменялся. Многие возможности и функциональность, которые изначально были написаны в Software 1.0, были перенесены в Software 2.0», — отмечает Карпатый.
По его словам, этот подход основан на использовании информации с изображений, полученных с нескольких камер, которая передается через нейронную сеть: «Мы смогли удалить много кода. Software 2.0 буквально съело стек Software 1.0 автопилота».
Карпатый считает, что подобный переход в разработке можно наблюдать в более широком масштабе по мере перехода к Software 3.0: «У нас есть новый вид ПО, и оно съедает весь стек».
«Есть три совершенно разные парадигмы программирования. Если вы только начинаете работать в этой отрасли, очень хорошо владеть всеми этими парадигмами, потому что у каждой из них есть свои плюсы и минусы, — говорит он. — Возможно, вы захотите запрограммировать какую-то функциональность в Software 1.0, 2.0 или 3.0. Собираетесь ли вы обучать нейронную сеть? Или просто намерены давать подсказки LLM? Или вам нужен явный кусок кода?»
Разработка и внедрение ПО стремительно меняются: от кодирования команд, склонившись над клавиатурой, к интерактивным диалогам с машинами. Новая эра Software 3.0 открывает широкие возможности для создания приложений.