ГОЛОСОВЫЕ ТЕХНОЛОГИИ

В Нью-Йорке с 26 по 27 октября в пятый раз прошла ежегодная выставка и конференция SpeechTek’99, посвященная голосовым технологиям (www.speechtek.com). В ней приняли участие около 60 экспонентов, среди которых такие компании, как IBM Speech Systems (www.software.ibm.com/speech), Philips (www.speech.philips.com), Unisys Corporation (www.marketplace.unisys.com/nlu/), Lernout & Hauspie (www.lhs.com), Lucent Technologies (www.lucent.com/speech), Dragon Systems (www.dragonsys.com) и др. Ими были продемонстрированы достижения в области преобразования текстовой информации в голосовую (Text To Speech, TTS) и автоматического распознавания речи (automatic speech recognition, ASR), связанных с ними проблем сжатия речевой информации, идентификации говорящего, машинного перевода, а также применения этих технологий в образовании, управлении, здравоохранении, банковской деятельности, производстве и т. п.

Генератор речи, разработанный Lucent Speech Solutions, кроме американского варианта английского, немецкого, французского и латиноамериканского вариантов испанского языка, заговорил на итальянском, классическом испанском и канадском варианте французского языка. Дополнительно это подразделение выпустило новый инструмент - Custom Dictionary Editor, - позволяющий пользователям быстро и легко изменять особенности произношения слов и фраз. С его помощью легко настроить систему TTS или ASR на слова и выражения, характерные для определенной области знаний или страны.

Компания Lucent Technologies объявила о том, что Unisys Corporation, Premiere Technologies и Cognitronics Corporation, разработчики деловых приложений, использующих голосовые технологии, будут применять ПО, созданное в Lucent Speech Solutions. Корпорация Unisys приобрела лицензию на применение ПО генерации речи, разработанного Lucent в своем продукте Universal Messaging, предназначенном для организации службы чтения электронной почты. Благодаря Universal Messaging с помощью обычного телефона можно прослушивать собщения, полученные по электронной почте.

Компания Premiere Technologies (www.premtek.com) также встроила TTS-технологию компании Lucent в свой пакет управления электронной почтой по телефону, позволяющий прослушивать сообщения электронной почты по телефону и управлять ими голосом. Как предполагает компания, эта служба окажется полезной деловым людям, вынужденным таскать с собой по всему свету ноутбук только для того, чтобы иметь возможность обмениваться электронной почтой.

Корпорация Cognitronics (www.cognitronics.com) использует ПО Lucent в приложениях, автоматически генерирующих голосовые объявления, например в телефонных справочных службах.

Корпорация Fonix (www.fonix.com), занимающаяся разработкой технологий TTS, ASR и технологией распознавания рукописного текста, объявила о переносе своих программных продуктов на микропроцессоры StrongARM. В настоящее время существуют версии TTS-, ASR-программ для процессора SA-1100, а вскоре они будут доступны и для SA-1110. Это означает, что в ближайшем будущем встраиваемые приложения, такие, как персональные цифровые секретари (PDA), Web-планшеты, сотовые телефоны, бытовая электротехника и др., начнут “прислушиваться” к тому, что мы говорим.

Любопытно, что сразу после завершения выставки SpeechTek’99 компания Microsoft объявила о приобретении фирмы Entropic (www.entropic.com), занимающейся разработкой ПО распознавания голоса на платформе Windows. Команда инженеров Entropic займется совершенствованием речевого интерфейса прикладного программирования (SAPI), с помощью которого программисты смогут, используя преимущества модели СОМ, создавать “говорящие” и “понимающие речь” приложения.

Версия для печати