Голосовой доступ к Web-содержимому может стать решающим средством расширения электронных рынков
Если твой магазин каждый день будут посещать все владельцы персональных цифровых секретарей с Web-функциями, ты быстро станешь миллионером без всякого волшебства Реджиса Филбина. Заполучи пару-тройку миллионов посетителей в день - и тебя сочтут гением электронной коммерции.
А что будет, если в виртуальном магазине начнет делать покупки даже малая толика пользователей обычных телефонов, которых в мире насчитываются миллиарды? Не хотите стать миллиардером?
Сегодня такая перспектива привлекает все больше компаний электронного бизнеса. Чтобы заманить к себе “телефонных” покупателей, они развертывают голосовые порталы, которые открывают доступ к содержимому Web-узлов и позволяют производить транзакции с помощью обычных телефонов. Фирмы priceline.com, Lycos, MapQuest.com и многие другие рассматривают голосовые технологии обработки Web-содержимого и обращения к услугам Всемирной паутины как средство решения чуть ли не всех проблем. С их помощью они собираются не только значительно расширить свой сегмент рынка, но и выделиться среди конкурентов.
“Сегодня мы можем предложить свои товары только тем, у кого есть доступ в Интернет, - говорит Тед Вейглос, президент Priceline Long Distance (Норфолк, шт. Коннектикут), дочерней фирмы priceline.com. - Но мы быстро расширяем рынок. Услуги priceline.com вскоре станут доступны не только пользователям компьютеров, но и абонентам обычной телефонной сети”.
Обеспечить телефонный доступ к Web-содержимому, впрочем, не так-то просто. Составляя планы развертывания голосовых порталов, менеджеры электронного бизнеса должны будут решить непростую дилемму: приступить ли к созданию портала собственными силами, что называется, с нуля или обратиться за помощью к поставщику приложений, которых становится все больше. Нужно быть крайне осмотрительными и при выборе технологии голосового портала из множества предлагаемых на сегодняшнем рынке. Скажем, технологии озвучивания информации Web-сайтов позволяют быстро организовать телефонный доступ к Web-магазину, однако их масштабируемость оставляет желать лучшего и они едва ли справятся со своими задачами, когда популярность узла возрастет. По оценкам экспертов, лучшей является стратегия, с первых шагов нацеленная на перспективу: выбирать рекомендуется только такие технологии, которые используют бурно развивающийся расширяемый язык разметки для голосовых приложений VoiceXML. Даже при том, что World Wide Web Consortium пока не одобрил первую версию этой спецификации, она просто обречена стать основой в деле предоставления интерактивных голосовых услуг во Всемирной паутине.
Зачем компьютер, если есть телефон?
Как ни велики трудности на пути к Web-торговле по телефону, специалисты уверены, что голос быстро станет одним из важнейших интерфейсов электронной коммерции. “С мобильных устройств в Интернет вскоре станут выходить чаще, чем с настольных компьютеров, - считает Элизабет Херелл, аналитик фирмы Giga Information Group (Санта-Клара, шт. Калифорния). - А когда мы прочувствуем все возможности портативных помощников, нам конечно же захочется услышать ту информацию из Всемирной паутины, которая сейчас выводится на экраны мониторов”.
И подобные желания - можно не сомневаться - будут набирать все большую силу. Консультационная фирма The Kelsey Group (Принстон, шт. Нью-Джерси) предсказывает, что к 2005 г. регулярными пользователями “голосовых порталов” станут 45 млн. владельцев беспроводных телефонов Северной Америки. А лондонская исследовательская компания Ovum прогнозирует быстрый рост рынка голосовых браузеров. По мнению ее экспертов, оборот этого рынка подскочит с 267 млн. долл. в нынешнем году до 26 млрд. долл. в 2005-м.
Первыми рынок голосовых порталов начали осваивать небольшие фирмы наподобие Tellme Networks, Quack.com и Talk2 Technology. Именно их руководителям пришла в голову мысль, что к Web-узлам можно подключаться с обычного телефона, чтобы узнать прогноз погоды или состояние дорожного движения, получить информацию о ресторанах и кинотеатрах. Идея пришлась по душе и крупным игрокам на этом поле. В мае фирма Lycos (Уолтэм, шт. Массачусетс) подписала с Quack. com соглашение об организации голосового портала, который откроет пользователям доступ к содержимому узла Lycos и ее услугам с обычного телефона.
“Персонифицированный голосовой доступ и информационное обслуживание становятся ключевыми факторами развития Интернет-услуг следующего поколения, - уверен Джейсон Павоуна, директор беспроводных и персонифицированных услуг Lycos. - Чтобы выйти на этот рынок первыми, мы налаживаем партнерские отношения”.
Почувствовав стремление компаний электронного бизнеса поскорее предоставить своим клиентам голосовой доступ, целый ряд производителей начал разработку соответствующего программного обеспечения и услуг. Среди их продуктов можно найти и полностью готовые к использованию системы для поставщиков приложений с доступом во Всемирную паутину через телефон. А некоторые компании, включая Nuance Communications, SpeechWorks и NetByTel.com, уже предлагают ПО и услуги для голосовой поддержки Web-содержимого, основанные на технологиях распознавания речи и компьютерного чтения текста. Не забывают создатели голосовых порталов и о моделях речевого управления приложениями, размещенными в сети. Потребность в них ощущают как те, кто хочет наладить обработку речевой информации в Интернете, так и те, кто стремится автоматизировать центры телефонного обслуживания или передать такие функции под управление соисполнителей.
Покупать или строить?
Как и в Lycos, в электронном магазине priceline.com решили начать внедрение технологии голосовых порталов с привлечения субподрядчиков, надеясь таким способом ускорить этот процесс. Вейглос установил тесные деловые отношения с представителями фирмы NetByTel.com (Бока-Рейтон, шт. Флорида), что позволило ему дополнить голосовыми функциями новейшую услугу своей фирмы - сетевое размещение заявок на дальнюю телефонную связь. На сегодняшний день клиенты priceline.com могут заказать междугородную и международную связь, подключившись к Web-узлу этой фирмы, а начиная с третьего квартала нынешнего года они будут делать это даже без помощи компьютера. Чтобы выйти на узел, пользователю будет достаточно набрать бесплатный телефонный номер и сказать, сколько минут он собирается разговаривать.
Когда номер набран, клиент подключается к автоматизированному центру телефонного обслуживания фирмы NetByTel.com и прослушивает меню доступных операций. Получив ответ клиента, сервер анализирует запрос с помощью программных средств распознавания голоса и связующего ПО, а затем извлекает запрошенную информацию с сайта priceline.com или проводит транзакцию на этом узле. Для обработки результатов запроса используются технологии преобразования данных в речь, так что ответ на вопрос клиента произносится по телефону обычным голосом.
В Priceline решили воспользоваться телефонной системой NetByTel, а не создавать собственную, чтобы избежать столь знакомых многим проблем управления и масштабируемости центров обслуживания по телефону. И здесь очень пригодился опыт NetByTel, центр сетевых операций которой способен одновременно обрабатывать до 1200 вызовов.
Все телекоммуникационные расходы, связанные с обслуживанием бесплатного номера priceline.com, NetByTel.com берет на себя. Взамен она требует оплаты каждой завершенной транзакции - обычно это несколько центов. При таком тарифе, считает Вейглос, достоинства голосовой автоматизации намного превосходят затраты на нее. Чего стоит одна только возможность отказаться от собственных центров телефонного обслуживания, где каждая транзакция обходилась priceline.com примерно в 5-7 долл.! Системы голосового обслуживания, способные, по словам Вейглоса, выполнять многие функции телефонных центров, гораздо дешевле в эксплуатации.
Не только наскрести информацию...
Кроме вопроса покупать или строить, занимаясь электронным бизнесом, приходится решать еще и проблему выбора голосовой технологии. Что лучше: взять на вооружение заказную систему, которую можно развернуть очень легко и быстро, или опереться на стандарты, заложив прочную основу на будущее? Прибегнув к услугам NetByTel,com, фирма priceline.com выбрала первый путь, основанный на технологии “озвучивания” содержимого Web-узла. Системы NetByTel.com с помощью собственных агентских разработок этой фирмы и ее функциональных модулей извлекают информацию с сервера priceline.com, а затем налаживают диалог этого сайта с клиентом по сети с ретрансляцией кадров. При такой схеме компании не пришлось вносить в свой узел никаких изменений, что и подкупило Вейглоса.
В то же время Всемирная паутина открывает клиентам priceline.com голосовой доступ к одной-единственной функции - заказу дальней телефонной связи. Но аналитики предупреждают: для тех компаний виртуального рынка, которые хотят предложить посетителям своих Web-узлов богатые информационные ресурсы и широкий спектр услуг, такая технология подойдет едва ли. Здесь гораздо лучшие результаты может дать перспективный стандарт VoiceXML. В отличие от HTML, XML и других современных сред, он содержит набор тегов (команд) для управления телефонными функциями.
Голосовой портал на базе VoiceXML работает следующим образом. Вместо того чтобы использовать для подключения к серверу Всемирной паутины компьютер и Web-браузер, пользователь звонит по обычному телефону. Получив голосовой запрос, сервер обращается к соответствующей Web-странице, преобразует содержащуюся там текстовую информацию в речевую и “читает” ее по телефону. При необходимости пользователь может активизировать голосом и гиперссылки. Извлечение информации в ходе всего процесса производится из базы данных Web-узла (см. схему).
“Практическая реализация VoiceXML станет огромным шагом вперед, потому что получать содержимое Web-узлов путем озвучивания Web-страниц далеко не так удобно, как представляется”, - уверена Херрелл из фирмы Giga Information Group.
Вам нужна карта?
Создание голосового портала на базе VoiceXML входит в планы нью-йоркской фирмы MapQuest.com, которая уже наладила передачу на мобильные телефоны информации о маршрутах движения к пункту назначения. Клиенты этого поставщика онлайновой географической информации отличаются высокой мобильностью, поэтому никаких сомнений в целесообразности внедрения новой технологии здесь не возникало. Само собой разумеется, что пользователям просто необходим голосовой доступ к богатейшей базе данных с картами.
“Мы рассматриваем голосовой доступ как идеальный способ обращения к нашим приложениям с дороги”, - рассказывает Кэйти Кинни, директор MapQuest.com по развитию бизнеса. Планирование голосовой стратегии началось в этой фирме прошлым летом.
MapQuest обратилась за помощью к фирме SpeechWorks (Бостон, шт. Массачусетс), и та взялась за создание голосовых приложений, интерфейса пользователя и телефонной системы. Когда клиент запрашивает услуги MapQuest. com по телефону, ПО SpeechWorks делит его речь на небольшие фрагменты, анализирует их и с помощью протокола HTTP пересылает запрос в одну из двух десятков унаследованных баз картографических данных MapQuest. Получив ответ, приложение передает информацию в голосовую базу данных, которая компонует заранее записанные речевые элементы в осмысленную фразу, содержащую рекомендацию, куда нужно ехать дальше. В последующем в качестве языковой спецификации планируется использование VoiceXML. При вводе данных она будет взаимодействовать со средствами распознавания голоса или системой Touch-Tone, а генерация ответов будет производиться путем преобразования текста в речь или воспроизведения заранее записанных фрагментов фраз.
Доступ к услугам MapQuest.com по телефону осуществляется через голосовой портал фирмы BeVocal; в конце нынешнего года к нему можно будет подключаться по бесплатному телефонному номеру.
Как вспоминает Кинни, вначале рассматривалась возможность озвучивания содержимого Web-узла с помощью технологий корпорации Oracle, однако окончательный выбор был сделан в пользу VoiceXML. Эта спецификация гарантировала: как бы пользователь ни подключался к узлу - через традиционный Web-браузер или по телефону, - он получит доступ к одной и той же информации из одной и той же серверной базы данных.
А значение такой унификации, по мнению экспертов, постоянно растет, ведь в распоряжении пользователей все чаще появляются устройства с интерфейсами обоих типов - и голосового, и браузерного. Путем голосового доступа в Интернет владельцы телефонов на основе протокола WAP (Wireless Application Protocol - протокол беспроводных приложений), например, вскоре смогут не только узнать, где им нужно свернуть, но и получить на экране своего браузера дорожную карту с проложенным маршрутом.
Есть у голосовых серверов на базе VoiceXML и еще одно серьезное достоинство: они хорошо масштабируются, а если компания решит передать управление телефонным обслуживанием в руки субподрядчиков, то это свойство проявится особенно сильно. Вот лишь один пример: фирма MapQuest использует на своем узле голосовые системы поставщика приложений Price Interactive (Рестон, шт. Виргиния), а сам Web-узел разместила на оборудовании фирмы Inflow.
“Ежедневно нам приходится вычерчивать 8 млн. карт и прокладывать 1,5 млн. маршрутов, - говорит Кинни. - Для выполнения такой задачи необходима высочайшая стабильность приложений. Наш Web-узел постоянно меняется, поэтому перевод на речь его содержимого нужных результатов не дал бы”.
А ведь когда голосовой доступ к Web-содержимому получит массовый размах - а руководство MapQuest.com и других сетевых компаний надеется, что это произойдет очень скоро, - гибкость и масштабируемость узлов приобретут жизненно важное значение. Нельзя забывать, что миллиарды телефонных абонентов во всем мире - это слишком большой рынок, чтобы его можно было прогнозировать.
Поговори со мной...
Хотя рынок голосового доступа к содержимому Всемирной паутины сравнительно молод, темпы развития здесь не могут не удивлять. К 2005 г. его стоимость должна повыситься до 26 млрд. долл. Быстрому росту способствует целый ряд факторов, включая совершенствование технологии распознавания речи, все большее расширение круга пользователей Интернета, оснащение телефонных аппаратов микробраузерами с голосовыми Web-интерфейсами.
Источник: Ovum.
Архитектура VoiceXML
Поговорим о новых возможностях Всемирной паутины
Вам надоели водители, которые на скорости 100 км/ч мечутся из ряда в ряд, пытаясь разобраться по мобильному телефону, где они находятся и куда дальше ехать?
Увы, придется к этому привыкать. Более того, ситуация на дорогах вскоре станет еще веселее, ведь водители начнут к тому же всматриваться в дисплеи своих телефонов.
В следующем году компании электронного бизнеса вроде MapQuest.com собираются вывести свои услуги на качественно новый уровень, интегрировав телефонный браузер на основе протокола WAP (Wireless Application Protocol - протокол беспроводных приложений) с голосовыми приложениями. Такое сочетание позволит их клиентам запрашивать по телефону направление движения или проводить операции электронной коммерции, а затем просматривать полученные результаты (карту с маршрутом поездки или выставленный счет) на дисплее своего WAP-браузера.
Подобные услуги очень важны в условиях борьбы за клиента.
“В Интернете есть масса информации, которую очень нужно быстро получить, но невозможно прослушать”, - отмечает Элизабет Херелл, аналитик фирмы Giga Information Group (Санта-Клара, шт. Калифорния).
По ее оценкам, средний слушатель способен усвоить за один раз не более пяти информационных фрагментов, поэтому вывод данных в визуальном формате значительно повышает функциональность Web-узлов. Очень скоро пользователи получат возможность заказывать нужную информацию по телефону, а ответы на свои запросы просматривать на дисплее.
На этот путь уже вышла нью-йоркская фирма MapQuest.com, которая активно ведет разработку системы голосового доступа к своим Web-ресурсам, но вовсе не собирается ограничиться этим. Здесь уже задумываются о поиске новых путей интегрированного обслуживания клиентов. По словам Кэйти Кинни, ее директора по развитию бизнеса, фирма намерена сочетать голосовой ввод запросов с комбинированным выводом результатов их выполнения. Когда это будет достигнуто, пользователи смогут получать схемы маршрутов по факсу или электронной почте, загружать их в персональные цифровые секретари, просматривать на экране телефонного WAP-браузера или прослушивать по телефону.
Однако для того, чтобы реализовать это на практике, как считает Кинни, “+необходимо иметь партнеров во всех основных точках доступа - только в этом случае услуга не будет зависеть от применяемых устройств”.
Такое обслуживание к тому же должно быть персонифицированным, статические HTML-страницы здесь мало что дадут.
И давайте надеяться, что картинки на экране мобильного телефона не слишком отвлекут водителя от управления машиной.