МУЛЬТИМЕДИА
MMX корпорации Intel расширяет возможности речевой технологии
Разработчики ПО распознавания и синтеза речи предлагают новые приложения для настольных ПК, используя возможности передовых технологий, таких, как мультимедиа-технология корпорации Intel. Тем самым они доказывают, что эти технологии распознавания наконец-то достигли зрелости.
Среди поставщиков новых продуктов - корпорация IBM, которая собирается лицензировать у фирмы Eloquent Technology пакет Eloquence для преобразования текста в речь, позволяющий воспроизводить сообщения электронной почты и другой текст голосом с естественными интонациями и с правильными ударениями. Как сказал представитель компании, IBM намерена включить Eloquence в свое ПО распознавания речи VoiceType следующего поколения, выпуск которого ожидается в 1997 г.
Juggler будет использовать возможности новых MMX-микросхем
корпорации Intel
“Распознавание речи сегодня работает действительно довольно хорошо, но люди всегда хотят большего”, - сказала Эйми Уол, редактор The TrendsLetter (Нарберт, шт. Пенсильвания).
Компания PureSpeech (Кеймбридж, шт. Массачусетс) вступит в конкурентную борьбу в I кв. 1997 г., представив Juggler - клиентский пакет, поддерживающий передачу голосовых сообщений на основе технологии MMX (расширение мультимедиа) корпорации Intel.
Функционируя как универсальный входной почтовый ящик для голосовой почты, электронной почты и факсов, Juggler может идентифицировать различные голоса, предоставляя 10 пользователям частные почтовые ящики с голосовым доступом.
Продукт включает также элементарные функции преобразования текста в речь и дает пользователям возможность прослушивать сообщения электронной почты по телефону.
Фирма Speech Systems (Болдер, шт. Колорадо) готовится представить комплект Phonetic Engine 1000 ($595) на базе PC-карты, обеспечивающий поддержку программ распознавания речи на портативных ПК и переносных устройствах.
Кроме того, в октябре компания NEC Computer Systems и фирма Kurzweil Applied Intelligence (Уолтем, шт. Массачусетс) объявили о включении в комплект поставки Pentium Pro-систем Ready Office компании NEC приложения VoicePad фирмы Kurzweil для голосовой обработки текстов. VoicePad позволяет форматировать текст, управлять меню, изменять установки приложения и диктовать числовые данные в документ. Как сообщил представитель Kurzweil, это ПО не требуется обучать голосу.
Начинающая компания Nuance Communications (Менло-Парк, шт. Калифорния) также разработала ПО распознавания речи под названием VoiceBroker, которое дает возможность владельцам ценных бумаг узнавать в реальном времени котировки акций по телефону. ПО было внедрено фирмой Charles Schwab (Сан-Франциско). Выход новой версии со словарем увеличенного объема и пониженными требованиями к памяти ожидается в ноябре.
Фирма Dragon Systems (Ньютон, шт. Массачусетс) готовит к выпуску в конце года инструментарий Dragon Speech Tool, который позволит пользователям разрабатывать собственные словари для приложений распознавания речи. Цена ПО пока не объявлена.
Телефоны и адреса компаний: IBM - (095) 940-2000 (в Москве),
(800) 426-3333 (в США), http://www. ibm.com; Eloquent Technology -
(607) 266-7025, http://www.eloq.com; PureSpeech - (617) 441-0000, http://www.purespeech.com; Speech Systems - (303) 938-1110, http://www.speechsys.com; Kurzweil - (617) 893-5151, http://www.kurzweil. com; Nuance - (415) 462-8200, http://www.nuancecom.com; Dragon - (800) 825-5897, http://www.dragonsys.com.
Скотт Беринато