В индустрии искусственного интеллекта происходят масштабные изменения: от одержимости большими инвестициями в предварительное обучение к новому рубежу — оптимизации выводов. Этот сдвиг меняет экономику ИИ, прокладывая путь к новым возможностям для инноваций и конкуренции, пишет на портале BigDATAwire Эндрю Филев — основатель и генеральный директор компании Zencoder.

На заре ИИ-революции доминировала простая философия: больше — значит лучше. Компании вкладывали миллиарды в обучение все более крупных моделей, полагая, что увеличение масштаба неизбежно приведет к повышению производительности. Одновременно с ростом эффективности это приводило к астрономическим затратам на вычислительную мощность и потребление энергии.

Сейчас мы наблюдаем более тонкую эволюцию. Подобно тому, как за последние 5000 лет люди не развивали более крупный мозг, а разрабатывали инструменты и социальные структуры для повышения практического интеллекта, индустрия ИИ находит способы делать больше с меньшими затратами. Фокус сместился с простого наращивания вычислительной мощности на изобретательное применение существующих ресурсов.

Ренессанс умозаключений

Примером новой эры являются недавние разработки таких производителей GPU, как SambaNova, Groq и Cerebras. Их достижения позволяют выполнять сложные ИИ-процессы за время, которое раньше уходило на обработку простого запроса. Такой скачок в скорости вычислений ведет к тому, что ИИ обретает способность думать и реагировать со скоростью человека — или даже быстрее.

Экономические последствия глубоки. Более быстрые выводы означают не только более быстрые ответы; они позволяют создавать совершенно новые области применения ИИ, которые ранее были непрактичны из-за проблем с задержкой. Возможности быстро расширяются: от перевода языка в реальном времени до мгновенного анализа сложных данных.

Революция в ценообразовании

Это касается не только аппаратного обеспечения. Даже гиганты мира ИИ адаптируются к новым условиям. Компания OpenAI, некогда ориентированная в основном на обучение все более крупных моделей, резко снизила стоимость использования своих моделей класса GPT-4. Цены на выходные токены резко упали с 60 долл. за миллион при запуске до 10 долл. сегодня, а стоимость входных токенов снизилась еще более значительно — в 12 раз.

Такое снижение цен — это не просто попытка сделать ИИ более доступным. Оно проливает свет на фундаментальные изменения в том, как создается ценность в экономике ИИ. Способность быстро и эффективно обрабатывать информацию становится более ценной, чем размер самой модели.

От моделей к системам

Модель o1 от OpenAI отражает это новое направление и, в отличие от предыдущих больших языковых моделей (LLM), называется «системой», которая использует планирование и рефлексию во время вывода для улучшения качества своих ответов. Это подобно тому, как человеческий мозг постоянно использует обратную связь для уточнения своих «черновых предсказаний».

Переход от статичных моделей к динамичным, самосовершенствующимся системам представляет собой новую парадигму, в которой теперь важно не только то, что знает модель, но и то, насколько быстро и эффективно она может применять эти знания в новых ситуациях.

Бум инструментария

Подобно тому, как развитие инструментов привело к тому, что предки человека превратились из обитателей саванны в творцов мира, интеграция специализированных инструментов расширяет возможности систем ИИ. Мы переходим от простых ответов на вопросы к сложным, многоступенчатым решениям проблем.

Это позволяет ИИ решать задачи, требующие не только знаний, но и стратегии и творческого подхода. Мы видим, как появляются системы ИИ, которые не просто отвечают на вопросы, но и эмулируют обратную связь, схожую с человеческим мышлением: от агентов по кодированию, которые могут исправить ошибки кодирования LLM, до «ИИ-ученого» Sakana, который может планировать и выполнять многоэтапные исследовательские проекты.

Будущее: сотрудничество, изобретательность и согласованность с действиями людей

В новом мире ИИ успех больше не гарантируется наличием самой большой модели. Вместо этого он будет сопутствовать тем, кто сможет наиболее эффективно использовать оптимизацию выводов, интеграцию инструментов и агентные рабочие процессы.

Последствия выходят далеко за рамки технологий: ИИ становится все более эффективным, дееспособным и интегрированным в повседневную жизнь. От персонализированного образования до гиперэффективных цепочек поставок — потенциал применения безграничен.

Важно отметить, что этот сдвиг в сторону оптимизации выводов и интеллекта, основанного на инструментах, представляет собой более перспективное и потенциально безопасное будущее для развития ИИ. Вместо мира, в котором все более крупные модели автоматически становятся все более интеллектуальными таинственным и потенциально неконтролируемым образом, мы движемся к более привычной и управляемой для человека парадигме.

Акцент на инструментах, рабочих процессах и совместном решении проблем отражает концепции, которые люди совершенствовали на протяжении тысячелетий. Люди также смогли справиться с ускорением вычислений: современные графические процессоры могут выполнять столько же умножений в минуту, сколько все люди на планете за год, однако мы не считаем GPU «сверхинтеллектуальными»; мы рассматриваем их как системные компоненты. Точно так же более быстрые LLM позволяют нам создавать лучшие и более интеллектуальные системы.

Такое согласование с человеческими способами мышления и работы должно привести к созданию систем ИИ, которые будут более интерпретируемыми, управляемыми и соответствующими человеческим ценностям. Это позволит нам использовать эти мощные возможности ИИ так же, как мы исторически использовали другие технологические достижения, — в качестве инструментов, дополняющих и расширяющих человеческие возможности, а не заменяющих их.

ИИ — это уже не просто мощная сила. Речь идет об умном применении ресурсов и изобретательности рабочих процессов, построенных на основе ИИ. Заменяя затраты на обучение на изобретательность в области умозаключений, мы не просто меняем принципы работы ИИ — мы переосмысливаем то, что он может делать.

Это новое направление развития ИИ не просто обещает более дееспособные системы; оно дает надежду на будущее, в котором искусственный и человеческий интеллекты смогут работать вместе более слаженно, используя сильные стороны обоих для решения сложных проблем нашего мира.