Как будет выглядеть искусственный интеллект в 2030-м, всего через пять лет? Исследование Epoch AI «AI in 2030: Extrapolating current trends», проведенное по заказу Google DeepMind, показывает, что при сохранении текущих тенденций масштабирования ИИ в скором времени сможет работать в масштабах, которые раньше считались недостижимыми, что будет иметь серьезные последствия для научных исследований и разработок, сообщает портал AIwire.

В отчете, подготовленном некоммерческой исследовательской группой Epoch AI, утверждается, что экспоненциальный рост вычислительных мощностей, данных и инвестиций может продолжиться до конца этого десятилетия, что обеспечит работу моделей ИИ, которые будут в 1000 раз более вычислительно-интенсивными, чем сегодня. По мнению авторов, такой масштаб выведет ИИ на новые рубежи в науке, от автоматизации кода и выполнения доказательств до улучшения прогнозов погоды. Однако преобразование этих цифровых прорывов в физические продукты, такие как новые лекарства или материалы, займет больше времени, поскольку будет ограничено факторами за рамками контроля ИИ.

Масштабирование как движущая сила

В отчете масштабирование представлено как основная движущая сила прогресса в сфере ИИ. Объем обучающих вычислений с 2010 г. увеличивался ежегодно примерно в четыре-пять раз, и Epoch AI ожидает, что эта тенденция сохранится, если инвестиции и инфраструктура будут развиваться такими же темпами. В отчете приводится информация о том, что крупнейшие ИИ-кластеры 2020 г. достигли пиковой производительности порядка экзафлопса, или около 1018 FLOPS. И если текущие тенденции масштабирования сохранятся, к 2030 г. кластеры, используемые для обучения передового ИИ, могут стоить более 100 млрд. долл.

«Такие кластеры смогут обеспечить производительность около 1029 FLOPS — чтобы произвести такой объем вычислений, крупнейшему ИИ-кластеру 2020 г. потребовалось бы непрерывно работать в течение более 3000 лет», — сообщает Epoch AI.

Эта оценка в 1029 FLOPS экстремально превосходит экзафлопный уровень и позволяет оценить прогресс, достигнутый на сегодняшний день в масштабировании вычислений, но достижение такого уровня в ближайшие пять лет может показаться весьма нереальным тем, кто был свидетелем пути к экзафлопным вычислениям. На это авторы отчета отвечают, что то, что на первый взгляд кажется экстремальным, является просто логическим результатом экстраполяции кривых, которые оставались стабильными на протяжении более десятилетия: «Это иллюстрирует повторяющийся паттерн в наших выводах: если сегодняшние тенденции сохранятся, они приведут к экстремальным результатам. Должны ли мы верить, что они сохранятся? За последнее десятилетие экстраполяция была надежной базой, и когда мы исследуем аргументы в пользу предстоящего замедления, они часто не являются убедительными».

Может ли масштабирование замедлиться?

Один из наиболее распространенных аргументов заключается в том, что масштабирование может вскоре «упереться в стену», и модели перестанут улучшаться даже при увеличении вычислительных мощностей. В отчете признается эта возможность, но отмечается, что последние модели продолжают демонстрировать высокие результаты в тестах, а также приносят беспрецедентные доходы. Пока нет явных доказательств того, что масштабирование теряет свою эффективность, хотя эту возможность нельзя исключать. На данный момент авторы отчета считают, что улучшения, скорее всего, будут продолжаться.

Еще одна проблема заключается в том, что в мире закончатся данные для обучения. Данные, основанные на текстах, созданных людьми, ограничены и могут быть исчерпаны в 2027 г. Авторы возражают, что синтетические данные стали надежной заменой, особенно сейчас, когда появились модели рассуждений, которые могут генерировать и проверять свои собственные учебные материалы. Мультимодальные источники данных также расширяют пул данных. Возможность возникновения узкого места остается, но представленные доказательства свидетельствуют о том, что дефицит данных вряд ли остановит масштабирование, как ожидают многие критики.

Электроэнергия — более сложная проблема, которую трудно игнорировать. При текущих темпах развития в 2030 г. для обучения потребуются гигаватты электроэнергии, сопоставимые с мощностью крупных электростанций. Поставка такой энергии будет дорогостоящей, и возникают вопросы о том, будет ли инфраструктура энергосистемы готова к увеличению спроса. В отчете выражается оптимизм и отмечается, что возобновляемые источники энергии и распределенные центры обработки данных могут поддержать кривую роста. Но это, пожалуй, самое вероятное ограничение, и стоит задаться вопросом, насколько компании могут расширить предложение, прежде чем затраты и общественное недовольство замедлят масштабирование.

Авторы предупреждают, что одним из наиболее вероятных рисков для продолжения масштабирования может стать ухудшение настроений инвесторов. Масштабирование ИИ может стать слишком дорогостоящим, что вынудит разработчиков отступить. Этот риск существует, но, согласно отчету, текущий рост доходов не показывает признаков замедления. Если доходы будут продолжать расти, они смогут поддержать запланированные на 2030 г. циклы обучения стоимостью в сотни миллиардов долларов. Эти цифры могут показаться фантастическими, но они соответствуют потенциальному росту производительности на триллионы долларов, если ИИ автоматизирует большой объем работы.

Некоторые предполагают, что прорывы в области алгоритмов могут заменить масштабирование в качестве движущей силы ИИ. Согласно отчету, этот фактор действительно повышает эффективность, но всегда в пределах той же кривой роста вычислительной мощности. Авторы отчета считают, что нет веских причин ожидать, что алгоритмы внезапно превзойдут по своему воздействию масштабирование аппаратного обеспечения, и на практике новые методы обычно создают больше причин для потребления вычислительной мощности, а не меньше.

Другой аргумент заключается в том, что ИИ-вычисления будут смещаться в сторону выводов, особенно с развитием моделей рассуждений. Обучение и выводы фактически развиваются вместе, и в настоящее время на них выделяются примерно одинаковые ресурсы. Кроме того, по мнению авторов, более качественное обучение позволяет создавать модели, которые делают выводы ИИ более ценными и рентабельными. В отчете отмечается, что смещение в сторону выводов возможно, но в ближайшее время оно вряд ли полностью подорвет масштабирование обучения.

Цифровая наука может ускориться, а физическая наука — отстать

В отчете также исследуется влияние ИИ на повышение производительности научных исследований и разработок. Если масштабирование сохранится, наибольший рост будет наблюдаться в цифровой науке. В области разработки ПО, согласно прогнозам отчета, задачи из существующих контрольных тестов, таких как SWE-bench, могут быть решены в 2026 году, а инструменты, способные решать сложные научные задачи кодирования, не отстанут от них. К 2030 г. ИИ будет способен самостоятельно устранять проблемы, внедрять функции и решать сложные (но четко определенные) научные программные задачи

Математика также находится на пути к быстрым достижениям. В 2027 г. системы ИИ могут стать способны помогать в таких задачах, как формализация набросков доказательств и разработка структур аргументации. В биологии ИИ будет все больше помогать в генерации гипотез, полагают авторы. Системы, обученные на данных о взаимодействии белков и лигандов, уже показывают многообещающие результаты в прогнозировании поведения молекул, и к 2030 г. эти системы смогут надежно отвечать на сложные биологические вопросы. В отчете содержится предупреждение, что эти прорывы останутся в основном в цифровой сфере, обеспечив большее количество потенциальных молекул, более точные прогнозы и более быстрые кабинетные исследования, а не приведут к появлению одобренных лекарств.

Еще одной областью, которая может извлечь выгоду, является прогнозирование погоды. Методы ИИ уже превосходят традиционные симуляции в краткосрочных и среднесрочных прогнозах, и в отчете утверждается, что дополнительные данные и точная настройка еще больше повысят точность моделей, особенно для редких событий.

Согласно Epoch AI, ограничивающим фактором для науки является не способность систем ИИ, а скорость физических процессов. Клинические испытания лекарств, получение разрешений регулирующих органов и логистика лабораторных экспериментов — все это происходит в многолетних циклах. Даже если ИИ предложит революционные методы лечения завтра, лекарства, которые одобрят в 2030 г., должны находиться в стадии разработки сегодня. Это приведет к разрыву: цифровые науки, такие как математика и ПО, будут переживать бурный рост, в то время как экспериментальные науки будут развиваться более медленными темпами.

ИИ как новый научный помощник

Одно из наиболее конкретных предсказаний отчета заключается в том, что к 2030 г. каждый ученый будет иметь доступ к ИИ-помощнику, сравнимому с GitHub Copilot. Эти системы будут помогать в обзоре литературы, проектировании белков и кодировании, обеспечивая 10-20%-ный рост производительности в кабинетных исследованиях, а, возможно, еще больше по мере совершенствования инструментов.

ИИ-помощники также могут повысить доступность научных исследований. Согласно отчету, с их внедрением в исследовательские рабочие процессы задачи, которые раньше требовали целых команд специалистов, могут быть демократизированы и стать доступными для отдельных исследователей и небольших лабораторий.

Выводы

Авторы отчета утверждают, что продолжение масштабирования может в короткие сроки вывести возможности ИИ далеко за нынешние рамки. Если кривые масштабирования сохранятся, крупнейшие циклы обучения 2030 г. будут потреблять энергоресурсы на уровне целых стран и стоить сотни миллиардов долларов. Такой уровень инвестиций оправдан только в том случае, если ИИ сможет обеспечить соответствующий рост производительности, и авторы отчета считают, что это вполне возможно.

В то же время в отчете содержится предупреждение о том, что роль ИИ в науке будет развиваться неравномерно. Наибольшую выгоду получат такие цифровые дисциплины, как ПО и математика, в то время как биология и другие экспериментальные науки по-прежнему будут связаны с более медленными процессами утверждения и тестирования. Более вероятным представляется появление ИИ-помощников в качестве стандартных исследовательских инструментов, которые изменят подход к работе с информацией, даже если ощутимые результаты появятся позже.

«К 2030 г. ИИ, вероятно, станет ключевой технологией во всех сферах экономики, присутствуя во всех аспектах взаимодействия людей с компьютерами и мобильными устройствами. Менее вероятно, но вполне возможно, что ИИ-агенты будут выступать в качестве виртуальных коллег для многих, преобразуя их работу за счет автоматизации. Если эти прогнозы сбудутся, то крайне важно, чтобы лица, принимающие ключевые решения, уделяли приоритетное внимание вопросам ИИ при разработке стратегии на ближайшие пять лет и далее», — отмечают авторы в своем заключении.