GigaChat 2.0 Сбера стал доступен каждому пользователю. Благодаря новому подходу к обучению существенно повысился уровень всех навыков модели. Искусственный интеллект научился распознавать голосовые аудиофайлы, глубже анализировать запросы пользователя, обрабатывать больший объём текста и распознавать изображения. Все возможности GigaChat доступны в одном продукте и на любой поверхности — таким образом пользователю не нужно переключаться между разными сервисами.
В модельный ряд вошли две версии на выбор пользователя — GigaChat 2 Pro и GigaChat 2 Max. Max — это самая продвинутая модель для решения сложных и профессиональных задач, а Pro подойдёт для быстрого и качественного решения повседневных задач, от получения ответов на различные вопросы до создания и редактирование текстов.
GigaChat 2.0 теперь умеет работать с актуальными данными из интернета, сервис глубже анализирует запросы, выдавая лаконичные ответы с ссылками на источники. Искусственный интеллект найдёт информацию за человека, отфильтрует главное и подкрепит свои выводы ссылками — по ним можно будет перейти, если пользователю понадобится дополнительная информация. Например, у модели можно спросить: «Куда сходить в Питере с детьми 7 и 12 лет на этих выходных»; «Сколько стоит отремонтировать стандартную однушку в Москве».
Теперь в одном диалоге доступна работа с несколькими файлами. В чат можно загрузить документ до 200 страниц текста А4. Пример запроса: «На что мне обратить внимание в договоре аренды? Ориентируйся на законы РФ». Также нужно приложить сам договор.
GigaChat 2.0 обрабатывает аудиофайлы на принципиально новом уровне — модель воспринимает звуковые данные напрямую, без промежуточного преобразования в текст. Это позволяет ей точнее выделять главное и отвечать на вопросы по содержанию — достаточно приложить запись и сформулировать запрос. Поддерживает файлы длительностью до 60 минут и 30 Мбайт. А если печатать неудобно или нет возможности, можно записать голосовое сообщение. GigaChat 2.0 умеет общаться на разных языках, лучше понимает сложные термины, качественнее распознаёт устную речь и акцент, а также посторонние звуки и музыку.
Примеры запросов: «Послушай аудиозапись и скажи, что в моих словах могло не понравиться коллеге»; «Выпиши список лекарств и рекомендаций из голосового от моего врача»; «Послушай запись видеозвонка и выпиши всё, что говорилось о наружной рекламе»; «Помоги структурировать мою речь для презентации проекта. [Текст речи]».
Теперь достаточно загрузить ссылки на нужные материалы — и GigaChat извлечёт важную информацию. Модель создаёт краткие обзоры по материалам сайтов, сравнивает статьи на одну тему, одновременно работает с несколькими ссылками и распознаёт картинки с сайтов. Пример запроса: «Помоги подготовиться к собеседованию на эту вакансию».
GigaChat 2.0 способен также обрабатывать видео по ссылке. За счёт понимания аудиодорожки модель может рассказать основную суть видеоэссе или ответить на вопросы по лекции (работает также с английским и другими языками). Пример запроса: «О чём видео? ссылка».
Функция генерации музыки и песен по текстовому запросу с помощью GigaChat вышла на новый уровень. Теперь максимальная длительность трека достигает трёх минут, при этом генерация занимает столько же времени (около 1 минуты). Команда повысила соответствие конечной генерации запросу, качество звука, а также улучшила генерацию песен на китайском языке.
Пример запроса: Нажмите кнопку «Создать песню», введите текст или тему для генерации, выберите жанр или опишите свой, например: «Трек в стиле современной молодёжной поп-музыки. Используй пульсирующий бас, яркие синтезаторы и плотный бит».
Модель может проанализировать и извлечь из картинки больше полезной информации и даёт более точные ответы по её содержанию. Например, может посоветовать, какой стиль одежды выбрать для конкретного случая, поможет решить уравнение из учебника или расшифровать медицинские анализы. Пример запроса: «Мне пришла квитанция ЖКХ. Объясни, за что я плачу?
Впервые в России умные колонки полностью переведены на большую языковую модель, благодаря чему их интеллектуальные возможности вышли на принципиально новый уровень:
- GigaChat ведёт живой диалог с пользователем на понятном ему языке или в заданной роли, удерживая нить беседы до 10 раз дольше. Например, может объяснить ребенку теорию относительности простыми словами или рассказать прогноз погоды от лица ведущего кинопремии;
- теперь искусственный интеллект управляет не только диалогом, но и прикладными навыками, такими как музыка или напоминания. А ещё несколько команд можно задавать сразу в одном обращении — колонка переключится между ними самостоятельно;
- также взаимодействие с ассистентом теперь подстраивается под пожелания пользователя — доступно 18 комбинаций настройки, включая стиль общения, голос ассистента, обращение на «ты» или на «вы».
Примеры запросов: «Салют, я нарисовал жирафа, но он выглядит скучно. Что можно добавить?»; «Салют, объясни теорию относительности семилетнему ребёнку»; «Салют, поставь будильник на каждый день на 6 утра и включи музыку для тренировки».
Одной из первых площадок, где появился GigaChat 2.0, стала российская цифровая платформа МАХ от VK. Это приложение со встроенным мессенджером, мини-аппами, конструкторами чат-ботов, системой онлайн-записи и платёжным сервисом. С помощью нейросетевой модели Сбера пользователи МАХ могут создавать тексты и изображения, расшифровывать аудио, получать краткие пересказы видео, статей и ответы на многие вопросы. Чтобы оценить возможности GigaChat, нужно найти в поиске @gigachat и затем следовать инструкциям.