Корпорация Microsoft выпускает сервер Speech Server 2004 (www.microsoft.com/speech/), в котором объединены средства обработки речи и поддержки телефонных разговоров. Он позволяет создавать всевозможные прикладные системы (в том числе способные общаться через браузер), основанные на технологиях распознавания и синтеза речи, а также комплексы обработки телефонных звонков. С помощью сервера можно, например, организовать автоматическую службу обработки звонков, навигацию по ресурсам которой пользователь выполняет тональными кнопками телефона по обычной или беспроводной линии, а также набором предопределенных голосовых команд.
Основная составляющая сервера - библиотека разработчика SDK, добавляющая типовые компоненты управления голосом на инструментальную панель Visual Studio.NET. При этом знания нюансов и деталей речевых технологий от программиста не требуется, использование возможностей сервера происходит путем визуальной настройки свойств этих компонентов.
В SDK входят редактор грамматики, позволяющий формально описать варианты общения программы с пользователем и задать допустимые фразы и слова, а также редактор голосовых подсказок, использующий заранее подготовленные WAV-файлы. Описания выполняются на базе спецификации Speech Application Language Tags, совместимой с VoiceXML.
Сервер, поддерживающий обработку 24 звонков одновременно, стоит $7999 на процессор, а корпоративная версия на неограниченное число звонков обойдется в $17 999.