Сотовые телефоны уже превратились в одно из главных средств беспроводного обмена данными, поэтому пользователи и Web-консультанты все чаще обращаются к производителям с требованием оснащать свои продукты средствами распознавания речи. И глас вопиющего не остается без ответа.
“Вводить данные по мобильному телефону чертовски трудно, - признает Ричард Барнуэлл, старший инженер фирмы Zefer (Бостон, шт. Массачусетс), которая помогает компаниям налаживать беспроводной электронный бизнес. - А тут еще начинаются разговоры о голосовых системах, голосовых интерфейсах и технологии VoiceXML”. (Voice Extensible Markup Language - расширяемый язык разметки для голосовых приложений.)
Чтобы облегчить ситуацию, Motorola, Oracle, IBM и некоторые другие производители приступили к созданию голосовых платформ, обеспечивающих выход во Всемирную паутину по беспроводным каналам.
В конце 2000 г. компании Motorola (www.motorola.ru) и Oracle (www.oracle.ru) рассказали, как они собираются помогать разработчикам, операторам связи и поставщикам бизнес-услуг в создании беспроводных приложений для деловой сферы. Первым шагом в этом направлении должна стать интеграция сервера приложений для беспроводных систем Oracle 9i Application Server Wireless Edition с сервером Wireless Application Protocol and Voice Server фирмы Motorola.
Тем временем IBM встраивает голосовые технологии в свою платформу электронного бизнеса WebSphere. Ею разработан программный голосовой сервер, содержащий механизм VoiceXML и несколько различных механизмов преобразования текстовой информации в речевую. Представители корпорации в Уэст-Палм-Бич (шт. Флорида) отметили, что, понимая заинтересованность клиентов в голосовых технологиях, IBM уже приступила к проведению бета-испытаний, которые должны определить основные направления развития подобных услуг на ближайшую пару лет.
В частности, фирма T. Rowe Price Associates проводит тестирование системы с интерфейсом на обычном языке. После развертывания пилотного проекта ее клиенты смогут получать доступ к своей финансовой информации, просто говоря компьютеру, что именно они хотят узнать. Новая технология способна воспринимать произносимые по телефону целые фразы, причем компьютер прогнозирует дальнейший ход “разговора”. Такая схема снижает вероятность того, что клиенту в конце концов придется переходить к меню “управляемого диалога”.
Однако, по оценкам представителей IBM, до того как такая технология будет отлажена и получит распространение, пройдет еще несколько лет.
Пока же пользователям больше нравится отвечать на вопросы системы, чем самим пытаться сформулировать запрос, понятный для компьютера, - так, по крайней мере, считает Даррен Уизманн, главный инженер фирмы Talk2 Technology (Солт-Лейк-Сити, шт. Юта). Специализируясь на приложениях распознавания речи, эта компания уже выпустила ПО, которое открывает голосовой доступ к системам электронной почты и календарной информации. По словам представителей Talk2, операторы связи намерены воспользоваться этой разработкой для развертывания новых услуг в 2001 г.
Судя по всему, беспроводные приложения вскоре будут поддерживать как данные, так и голос. С их помощью, например, пользователь сможет позвонить в авиакомпанию и голосом задать вопрос о расписании рейсов, а ответ прочитать на экране своего сотового телефона.
Правда, в США беспроводные сети пока не обеспечивают одновременной поддержки голоса и данных. В Европе такие смешанные услуги уже оказывают, однако их схема не столь проста, как хотелось бы: задав вопрос, пользователь должен положить трубку, а затем ждать ответа через службу коротких сообщений SMS (Short Message Service).