Поскольку генеративный ИИ (GenAI) становится все более популярным, многие участники рынка смартфонов объявили о создании собственных наборов ИИ-инструментов для усовершенствования новых моделей, пишет в корпоративном блоге Киранджит Каур, помощник директора по исследованиям в области данных и аналитики IDC Asia/Pacific.

Применение GenAI в смартфонах быстро превращается в ключевой вектор дизайна для их производителей.

Согласно последнему прогнозу IDC, в 2024 г. поставки GenAI-смартфонов вырастут на 364% по сравнению с предыдущим годом и достигнут 234,2 млн. единиц, а в 2028-м увеличатся до 912 млн. единиц, что означает совокупный годовой темп роста (CAGR) 78,4% в период 2023-2028 гг.

За последний год многие участники рынка объявили о создании собственных наборов ИИ-инструментов для демонстрации изменений пользовательского интерфейса смартфонов. Они основаны на различных фундаментальных моделях, больших (LLM) и малых (SLM) языковых моделях, позволяющих использовать функции GenAI с обработкой непосредственно на устройстве, а также мультимодальном вводе и выводе. При этом OEM-производители применяют гибридный подход к реализации функций ИИ — на базе устройств для локализации и на базе облачных технологий для интенсивных вычислений.

Хотя многие из этих ИИ-функций в настоящее время ограничены смартфонами премиум-класса, следует ожидать, что они будут просачиваться вниз по модельному ряду благодаря использованию облачных ИИ-решений, поскольку эти устройства не будут иметь необходимого оборудования. Тем не менее, уменьшение масштабов и конфиденциальность/латентность остаются ключевыми факторами. Ниже приведены некоторые из этих характеристик и их отличия у разных OEM-производителей.

OEM-производители добавляют свой уникальный ИИ-вкус

Хотя ИИ-функции подпадают под одни и те же широкие категории для всех основных платформ и устройств, каждый OEM-производитель накладывает свой уникальный отпечаток, наряду с инструментами от Google и OpenAI.

Почти все ключевые OEM-производители анонсировали функции/инструменты для редактирования фото/видео, написания/редактирования, перевода и интерпретации, подведения итогов, улучшения поиска и т. д., ориентированные на наиболее используемые сценарии применения смартфонов. Для большинства пользователей не имеет значения, связано ли это с ИИ, лишь бы результат был лучше. Например, пользователей больше интересует конечная портретная фотография, чем аппаратное или программное обеспечение или ИИ.

Большим хитом, по мнению участников рынка, являются Circle to Search, ИИ-функция Google, привязанная к Android 14, которую Samsung упомянула в своем финансовом отчете в апреле 2024 г. как самую используемую, и AI Eraser, которая, по утверждению OPPO, используется в среднем 15 раз в день. Живой перевод — еще одна чрезвычайно полезная функция, преодолевающая языковые барьеры, которой можно удобно пользоваться даже в автономном режиме. Также все больше внимания уделяется здоровому образу жизни: например, Google предлагает функцию обнаружения сна и храпа, Samsung недавно объявила об обнаружении апноэ во сне, а Apple говорит о мониторинге жизненных показателей.

ИИ-функции — это расширение представления бренда

В то время как использование функций GenAI конечными пользователями обусловлено их потребностями, OEM-производители используют ИИ-функции в качестве дополнения к своему бренду, чтобы выделиться на фоне других.

  • Apple анонсировала возможности GenAI под названием «Интеллект Apple» («Apple Intelligence»), указывающим на то, что ИИ теперь занимает центральное место во всех устройствах компании, с функциями, разработанными для обеспечения кросс-функциональности различных приложений и устройств iPad, iPhone и Mac. Возможно, это не радикально новый способ взаимодействия пользователя с iPhone, но расширение функциональности приложений и таких развлечений, как создание персонализированных воспоминаний, Genmojis и аватаров. Модернизированная Siri с доступом к базовым данным пользователя (электронная почта, сообщения, фотографии, местоположение, файлы и т. д.) сможет лучше ориентироваться на контекст, оставаясь при этом верной своей главной идее о конфиденциальности, даже когда пользователь подключается к ChatGPT. Вертикально интегрированный подход Apple опирается в основном на собственные языковые модели и частную облачную инфраструктуру, а по ChatGPT компания сотрудничает с OpenAI.
  • Google продолжила свой путь использования ПО для расширения возможностей смартфонов. В Pixel 8 Pro реализован ряд функций GenAI на устройстве за счет использования языковых моделей. Среди них такие функции, как управление вызовами (Clear Calling, спам-звонки, Call Assistant), редактирование фото/видео (Photo/Audio Eraser, Best Take), общение (Proof Read, Smart Reply, Summarize, Magic Compose) и т. д. Для Google может оказаться проблемой размытая грань между тем, что является уникальным для смартфонов Pixel и остальной линейки Android. Компания справляется с ней, предлагая некоторые функции сначала только на смартфонах Pixel, а затем более широкому кругу пользователей Android.
  • Продолжая уделять особое внимание камерам и фотосъемке, OPPO предлагает такие функции, как AI Best Face, AI Eraser, AI Studio и AI Clear Face, а также расширяет возможности ИИ на широкий спектр приложений для общения и повышения производительности. Компания также представила инструменты Social Media Creation, помогающие создавать контент, специально предназначенный для платформ социальных сетей.
  • Samsung недавно запустила инструменты ИИ для флагманской серии Galaxy S24 и Galaxy Z Fold6, а также расширила некоторые из этих функций на свои старшие модели, сосредоточившись на общении и производительности. Особо выделяются функции живого перевода и переводчика в реальном времени. Galaxy AI включает в себя Photo Assist, Instant Slow-Mo, AI summary, Chat Assist и инструменты написания/редактирования Magic. Такие функции, как двухэкранный режим для переводчика, адаптированы под складной форм-фактор.
  • Хотя другие игроки на рынке Android также анонсировали инструменты ИИ — субтитры для видеозвонков и редактор изображений от Xiaomi, функции ИИ для отслеживания глаз от Honor, функции персонализации и конфиденциальности от Motorola — партнерство с Google остается жизненно важным для получения доступа к более широкому набору инструментов, интегрированных в ОС Android.

Еще одна область дифференциации — размер и количество LLM, а также используемые обучающие материалы, которые влияют на производительность и пользовательский опыт (UX). Apple использует собственные языковые модели, а для задач, выходящих за рамки ее компетенции, — OpenAI. Android-игроки используют модели Gemini (Pro и Nano) и множество других моделей разного размера. У OPPO есть собственная SLM, использующая 7 млрд. параметров, а также LLM AndesGPT в дополнение к Gemini. Также имеются партнерские отношения с другими технологическими компаниями, включая Qualcomm, MediaTek и Microsoft.

Кроме того, существуют различия в исполнении этих функций и их доступности для сторонних приложений.

  • Разработчики приложений для iOS имеют опыт автоматизации задач или работы с такими функциями, как Siri Intents и Shortcuts. Например, разработчики приложений, в которых уже интегрирован SiriKit, могут сразу же оценить новые возможности Siri. Некоторые из ИИ-инструментов, такие как инструменты для письма, легко доступны сторонним разработчикам для их приложений.
  • Google также предоставляет разработчикам API и SDK для интеграции Gemini в их приложения. Однако Google, OEM-производителям и разработчикам приходится работать с различным аппаратным обеспечением разных Android-смартфонов и обеспечивать адекватное тестирование для бесшовной интеграции.

ИИ будет играть центральную роль в развитии пользовательского интерфейса смартфонов

Возможность и задача для OEM-производителей заключается в том, чтобы обеспечить UX, соответствующий шумихе вокруг ИИ. В частности, OEM-производители могут использовать ИИ, чтобы преодолеть усталость пользователей от аппаратных функций, которые были восприняты как скучные. Подобно тому, как мы сейчас используем диктовку, предсказание текста и редактирование фотографий, эти новые ИИ-функции также станут повседневными инструментами на смартфонах.

Ниже приводится краткое описание основных аспектов, которые OEM-производителям необходимо будет выдвинуть на первый план, когда они приступят к следующему этапу эволюции смартфонов.

  • В целом, более персонализированный, интуитивно понятный и удобный опыт, который не прерывает обычный рабочий процесс, может обеспечить большую приверженность. Если пользователи iPhone отличаются высокой лояльностью, то с пользователями Android дело обстоит иначе: они легко переходят с одного бренда на другой. Радикальные изменения, такие как выбор в пользу основанного на ИИ устройства без приложений, еще не стали достоянием широких масс, в то время как традиционный интерфейс с приложениями может быть немного устаревшим и неэффективным для продвинутых пользователей. Промежуточный подход с генеративным пользовательским интерфейсом может перевести пользователей на путь ИИ более постепенно.
  • Сетевое подключение также будет играть ключевую роль в обеспечении более быстрого, плавного соединения и беспрепятственного использования функций ИИ, особенно при наличии облачной обработки. Вместе с более быстрой обработкой данных на устройстве, подключение к сетям Wi-Fi 6/7 и 5G будет способствовать более быстрому отклику с меньшей задержкой. Это также будет способствовать демократизации ИИ, расширяя использование смартфонов с функциями облачного ИИ.
  • Конфиденциальность пользователей будет по-прежнему занимать центральное место в этом опыте, что отчасти обеспечивается ИИ на устройстве, но также отражается в философии компании, которая стремится обеспечить конфиденциальность пользовательских данных, одновременно контекстуализируя их для предоставления более персональных результатов. Побочным преимуществом ИИ на устройствах является то, что благодаря передаче обработки ИИ на всю установленную базу устройств требуется гораздо меньше капитальных затрат на серверы, чем если бы ИИ обрабатывался только на серверах.
  • Поскольку функции ИИ выходят за рамки нативных приложений и начинают интегрироваться в приложения сторонних разработчиков, необходимо сотрудничать с ними, чтобы привнести эти функции в большее количество приложений и обеспечить разработчикам простые способы интеграции ИИ в свои приложения.

OEM-производители, опираясь на шумиху вокруг ИИ, разрабатывают и интегрируют функции ИИ в свои смартфоны, одновременно просвещая и убеждая пользователей в преимуществах ИИ. В конце концов, в плане привлечения большего числа пользователей к своему бренду, использование возможностей ИИ может иметь далеко идущие последствия, выходящие за рамки быстрого обновления модельного ряда.