Блокчейн Искусственный интеллект Open Source Интернет вещей Big Data/Аналитика Цифровая трансформация Инновации	Сети/Серверы/СХД/ЦОД ПК и периферия Мобильные решения Инфраструктура	Документооборот/ECM Идеи и практики автоматизации Промышленная автоматизация ИТ-менеджмент Автоматизация	Государство и ИТ ИТ-бизнес ИТ-индустрия	Облака	Безопасность
Искусственный интеллект: Статьи Новости компаний Решения

Панорама

UserGate DCFW: NGFW для защиты сетей уровня ЦОД

Компания UserGate, отвечая на запрос крупных российских компаний получить отечественный высокопроизводительный …

15 мин на изменение логики продукта: как AI-ассистент Bercut помогает в интеграционных проектах

Одна из основных задач в ходе любого интеграционного проекта — настроить оптимальное взаимодействие данных …

Что такое «коробочная» SIEM и когда она нужна?

Системный аналитик «СёрчИнформ» Павел Пугач рассказывает, как облегчить выполнение требований закона по внедрению SIEM …

Как ИЦ ТЕЛЕКОМ-СЕРВИС построил инженерную инфраструктуру для функционирования ключевых ИТ-систем и эффективной работы сотрудников новой штаб-квартиры Т-Банка в БЦ AFI Square

Залогом успешной реализации в 2023-2024 годах ИЦ ТЕЛЕКОМ-СЕРВИС одного из самых значимых проектов на строительном рынке …

Сбер открыл публичный доступ к платформе синтеза и распознавания речи SaluteSpeech для реализации некоммерческих проектов

Пресс-релиз | 29.11.2022

Команда SberDevices сделала публичным доступ к своей платформе синтеза и распознавания речи SaluteSpeech для реализации некоммерческих проектов. Ранее получить доступ к платформе могли только юридические лица и индивидуальные предприниматели. Для некоммерческого использования речевых технологий платформы потребуется только регистрация на портале.

Открытый доступ к платформе SaluteSpeech поможет пользователям быстро и эффективно решать множество задач. Студенты могут транскрибировать лекции, блогеры — озвучивать ролики, авторы — создавать аудиокниги.

Также есть сценарии использования публичной версии для бизнеса. Средний и малый бизнес может озвучить презентационные материалы либо транскрибировать аудиозаписи встреч или интервью для последующей работы с текстом. Крупный бизнес получает возможность оперативно протестировать технологию Сбера до принятия решения о дальнейшем сотрудничестве.

Денис Афанасьев, директор дивизиона В2В-продуктов Салют SberDevices, отметил: «Наша команда очень много выступает на мероприятиях перед студентами — мы рассказываем им о речевых технологиях, — и я очень рад, что теперь они могут полноценно их протестировать и создать свои первые проекты, которые, уверен, положат начало чему-то большому и важному в будущем. Также это отличный инструмент для людей, у которых возникает бытовая потребность в переводе текста в голос и наоборот. Отмечу, что таких немало. И, конечно, ещё одна важная задача этого проекта дать бизнесу возможность для тестирования платформы SaluteSpeech. Благодаря свободному доступу все желающие в удобный для них момент могут подключиться к платформе и оценить качество работы её технологий».

Публичный доступ к платформе доступен только для некоммерческого использования. Распознавание речи в этом формате для физических лиц ограничено 100 минутами в месяц. К примеру, продолжительность одной лекции — 60 минут, а деловая встреча в среднем длится от 40 до 60 минут. Синтезировать можно текст на 200 000 символов в месяц — этого достаточно, чтобы создать небольшую аудиокнигу примерно на 100 страниц.

Доступ к SaluteSpeech для реализации коммерческих проектов исключает эти ограничения. При работе с облачной версией платформы клиент платит по количеству секунд для распознавания речи и по числу символов для её генерации. Если заказчик разворачивает систему в своём контуре (on-prem), он платит за количество лицензий.

Платформа SaluteSpeech позволяет подключать речевые технологии в интерактивном голосовом меню (IVR), автоответчике, чатах, телемаркетинговых компаниях, голосовых интерфейсах взаимодействия, для озвучивания контента и команд или голосового ввода на устройствах и сайтах. Сервисы платформы распознают и синтезируют речь, а также способны воспринимать подсказки, помогающие максимально правильно понимать пользователя в зависимости от конкретной ситуации. Технологии распознавания и синтеза речи можно использовать как вместе, так и по отдельности.

Печать

	События
	Осталась неделя до конца регистрации «В Облаке.РФ»! 15 — 16 апреля 2025 г. (вторник — среда), Москва Какие технологии станут реальностью завтра? 17 апреля 2025 г. (четверг), 10:30 — 18:30

Статьи по теме

Подъем ИИ запускает вторую волну модернизации больших данных

Идея управления данными в огромных масштабах едва ли нова. Большинство компаний приняли концепцию «больших данных» …

Как агенты ИИ тихо трансформируют фронтенд-разработку

Агенты искусственного интеллекта, которые могут проводить A/B-тесты, оценивать влияние на производительность …

Gartner: готовьтесь тратить больше денег на генеративный ИИ

Вы знаете, сколько денег ваша компания уже тратит на продукты и проекты генеративного искусственного интеллекта …

Forrester: транслитические базы как основа для современных приложений ИИ

Растущий спрос на данные реального времени для работы приложений искусственного интеллекта заставляет компании …

ИТ-инженеры внедряют ИИ, но их трудозатраты растут. Почему?

Исходя из статистических данных может показаться, что существует причинно-следственная связь между ростом внедрения …

Сбер открыл публичный доступ к платформе синтеза и распознавания речи SaluteSpeech для реализации некоммерческих проектов

Комментарии