Блокчейн Искусственный интеллект Open Source Интернет вещей Big Data/Аналитика Цифровая трансформация Инновации	Сети/Серверы/СХД/ЦОД ПК и периферия Мобильные решения Инфраструктура	Документооборот/ECM Идеи и практики автоматизации Промышленная автоматизация ИТ-менеджмент Автоматизация	Государство и ИТ ИТ-бизнес ИТ-индустрия	Облака	Безопасность
Искусственный интеллект: Статьи Новости компаний Решения

Панорама
Российский суперапп для бизнеса eXpress: новые фичи в 2024 году и планы по развитию В 2024 году рынок корпоративных коммуникаций продолжил …

Система распознавания речи может сравниться с человеком

Пресс-релиз | 25.08.2017

Технология распознавания голоса Microsoft впервые достигла уровня, аналогичного человеческому. Исследователям Microsoft Research удалось снизить долю ошибок до 5,1%, тогда как у человека этот показатель по данным ученых составляет от 5 до 6%. Это значительный шаг вперед по сравнению с показателем 6,3%, который система распознавания Microsoft показывала в сентябре 2017 года.

В научной работе, опубликованной сотрудниками Microsoft Research, описаны последние нововведения, которые позволили достичь настолько низкого уровня ошибок. Ученые использовали сочетание свёрточной нейронной сети (CNN) и модели долгой краткосрочной памяти (LSTM), а также ряд подходов, которые и ранее применялись в машинном распознавании речи.

Для проверки результатов использовался тест Switchboard («Коммутатор») — это общепринятый в индустрии языковой корпус, на котором испытывают работу машинного распознавания английской речи. Он состоит из записей разговоров нескольких человек на определенные темы.

Существует и другой, более сложный тест, он называется CallHome («Звонок домой»), где собеседников больше, а тема разговора не задана. В нем нейросетям пока что лишь предстоит сравняться с человеком: частота ошибок машинного распознавания речи Microsoft здесь еще превышает 10%, но учитывая темпы прогресса в этой области, она тоже скоро может приблизиться к результатам человека. Среди других задач, которые предстоит решить ученым — распознавание речи на совещаниях, где люди зачастую говорят одновременно.

Технология распознавания речи используется в операционной системе Windows, цифровом ассистенте Cortana, Microsoft Office, Skype и прочих приложениях компании. Предполагается, что ее улучшенная версия будет введена в эксплуатацию в ближайшие несколько месяцев.

Печать

Система распознавания речи может сравниться с человеком

Комментарии