Статья только в электронной версии журнала

Статья только в электронной версии журнала

Майкл Мюллер    

Голосовое общение с компьютером еще не достигло уровня систем голосового управления бытовой техникой, но прогресс в технологии распознавания речи налицо.

И крупнейшие производители типа IBM и Microsoft, и маленькие компании, такие, как L&H (Lernout & Hauspie Speech Products USA, Берлингтон, шт. Массачусетс), работают над тем, чтобы речевой ввод стал столь же обычным делом, как работа с мышью.

“Нашу нынешнюю позицию можно сравнить с той, что была в то время, когда состоялся дебют графических интерфейсов,- утверждает Боб Катник, старший вице-президент и главный технолог L&H, выпустившей систему речевого ввода Voice Xpress.- Когда мышь только появилась, вы не знали, как за нее взяться. Попробуйте сегодня убрать это устройство- и ваши приложения не смогут работать”.

Руководители Microsoft не столь упорны в отстаивании голосовых технологий, однако считают их потенциал достаточно высоким для того, чтобы инвестировать в L&H 45 млн. долл.

“Эта идея- обработка вводимых с голоса предложений естественного языка в прикладных программных системах- ближе к реальности, чем включение обработки речи в качестве одной из составляющих нашей ОС”,- полагает Стив Кэпс, разработчик пользовательского интерфейса в Microsoft.

При введении средств работы с естественным языком компьютер будет понимать текст или звучащую речь в рамках контекста и даже различать омонимы, например “луг” и “лук”.

“Нам надо добиться того, чтобы компьютер понимал контекст предложения, а в случае затруднений переспрашивал пользователя о значении или специфическом применении слова”,- рассказывает Катник.

Впереди, конечно, еще много работы в области речевых технологий- их улучшения и расширения словарного запаса. По-прежнему серьезным барьером на пути их внедрения остаются социальные причины. “Представьте себе разговор с компьютером в самолете, в офисе. Как это будет происходить? Вот проблемы, которые мы должны решить”,- сказал Кэпс.

IBM надеется, что ответом могут стать так называемые многорежимные устройства, использующие как ПО распознавания речи, так и перьевые интерфейсы. В подразделении T.J.Watson Lab (Хоторн, шт. Нью-Йорк) компания работает над созданием подобного устройства, которое будет опираться на недавно усовершенствованное ПО распознавания речи ViaVoice. Новая программно-управляемая система работает с любым ПК на базе Windows 95/Windows 98 и, по словам представителей IBM, скорее всего, выйдет в ближайшие два года.

Хотя по этой технологии ведутся интенсивные работы, производители не считают, что речевые интерфейсы станут преобладающими. “Мы никогда не говорили, что речевой ввод заменит клавиатуру или мышь, он просто будет дополнять их”,- формулирует свою идею Катник.

Версия для печати