Фирмы Lernout & Hauspie Speech Products USA и Lucent Technologies достигли новых успехов в усовершенствовании голосовых приложений.
В начале апреля L&H (www.lhsl.com) объявила о своем намерении предоставить корпорации Microsoft два многоязыковых механизма - распознавания речи ASR (Automatic Speech Recognition - автоматическое распознавание речи) и чтения текста TTS (Text-to-Speech - преобразование текста в голос). Оба они предназначены для интерфейса прикладного программирования Microsoft SAPI 5.0 (Speech API - голосовой API) и призваны помочь разработчикам приложений для ПК в создании мультимедийных и встроенных программ.
Новые механизмы фирмы L&H, обеспечивающие поддержку SAPI 5.0 на нескольких языках, будут включены в очередную версию комплекта разработки голосовых приложений Speech SDK корпорации Microsoft (www.microsoft.com). Кроме них в состав SAPI 5.0 SDK войдут межплатформное ПО SAPI, механизмы ссылок на ASR и TTS, файлы исходных текстов, образцы программ, инструментарий и документация, помогающие разработчикам в создании голосовых механизмов и приложений.
Голосовой сервер Speech Server фирмы Lucent (www.lucent.com), также представленный в начале апреля, рассчитан на поставщиков услуг Интернета и на те фирмы, которые обеспечивают совместную передачу голоса и данных. С его помощью можно будет предоставлять клиентам доступ к информации, хранящейся во “Всемирной паутине”, по обычному телефону, с использованием естественных голосовых команд.
Speech Server оснащен механизмами распознавания речи и чтения текста, разработанными фирмой AT&T Bell Laboratories, которые налаживают мосты между голосовыми сетями и Интернетом. Сервер поддерживает язык VoiceXML (Voice Extensible Markup Language - расширяемый язык разметки для голосовых приложений), позволяющий разделять голосовые и коммуникационные ресурсы приложений, совместимых со спецификациями Форума VoiceXML.
С помощью этого языка независимые разработчики смогут создавать приложения, передающие в речевой форме самую разнообразную информацию. Это могут быть подборки новостей, прогнозы погоды, биржевые сводки, деловые и финансовые сообщения, ассортимент товаров и цены на них в онлайновых магазинах, сведения из каталогов и даже развлекательные передачи. Водитель машины, например, сможет, даже не обращаясь к услугам компьютера, набрать телефонный номер и прослушать составленную специально для него сводку о ситуации на дорогах.