Лора Смит

Случай из практики: брокерская контора решает проблемы перегрузки центра обработки звонков, совершенствуя автоматическую систему с голосовым ответом

Часто ли, набрав телефонный номер организации, вы бываете вынуждены нажимать кнопку “0”, чтобы вырваться из паутины входного меню? В шести случаях из десяти? Ну вы не одиноки.

Именно по этой причине фирма Charles Schwab & Co. решила дополнить свою систему интерактивного голосового ответа (IVR - interactive voice response) средствами распознавания речи.

Боб Уолсен, директор Schwab по технологии. Он -за распознавание речи

Невзирая на все усилия, направленные на автоматизацию центров обработки звонков, обозреватели отрасли отмечают, что клиенты не слишком склонны к ведению переговоров с системами IVR. Почти 60% из них предпочитают разговор с “другим человеческим существом” - по той ли причине, что система не предлагает им подходящего варианта, или потому, что, по их мнению, в разговоре с живым представителем компании они сэкономят время и избегут лишних ошибок. Это особенно верно для случаев, когда клиенту предстоит осуществить такую сложную операцию, как, например, заказ авиабилета, покупка акций или получение сведений о местонахождении бандероли, отправленной экспресс-почтой.

По крайней мере, так обстояли дела до недавнего времени. За последние полтора года технология распознавания речи достигла такого уровня зрелости, что ее ранним пользователям, например фирмам Schwab; Sears, Roebuck and Co.; United Parcel Service of America, она уже дает определенные преимущества. ПО распознавания речи, которым дополняются имеющиеся системы IVR (рассчитанные на ввод ответов с клавиатуры телефона с тональным набором номера), позволяет обращаться с запросами к ним на естественном языке.

“Уж как я не люблю это слово, но здесь без него не обойтись, так как происходит настоящая смена парадигмы в использовании телефона, - говорит президент фирмы TMA Associates и редактор бюллетеня новостей Speech Recognition Update (Тарзана, шт. Калифорния) Уильям Майзель. - Речевое общение намного эффективнее. Это грандиозное изменение в возможностях использования телефона и организации его взаимодействия с другими системами”.

Майзель считает, что доходы от сбыта оборудования и ПО распознавания речи на территории Соединенных Штатов к 2003 г. увеличатся до 22,6 млрд. долл. - с 356 млн. долл. в прошлом году.

При использовании автоматической системы, оснащенной средствами распознавания речи, средняя продолжительность звонка обычно оказывается меньше, чем при разговоре двух людей, когда произносится много лишних слов.

Автоматизация центров обработки звонков с применением систем IVR и средств распознавания речи, по оценке Майзеля и других аналитиков отрасли, позволит типичной компании снизить затраты по сравнению с применением систем с людьми-операторами чуть ли не на 90%. Полученные Schwab результаты вполне оправдывают эти прогнозы: 90% ее клиентов для получения информации о текущих котировках акций, ценных бумаг фондов взаимного инвестирования и опционов обходится без обращений к оператору, вполне удовлетворяясь услугами системы Voice Broker. Как сообщает вице-президент Schwab по речевым технологиям Эди Хейлман, система Voice Broker выполняет для компании такую работу, для которой иначе потребовалось бы два центра обработки звонков производительностью по 50 тыс. обращений в день каждый. В ней используется ПО распознавания речи Conversation Transaction Technology фирмы Nuance Communications из Менло-Парка, шт. Калифорния (см. врезку).

Первые пользователи    

При такой экономии нетрудно понять, что заставило руководство Schwab выделить на внедрение этой технологии столь значительные ресурсы и стать в очередной раз зачинщиками нововведений в своей отрасли. Ряд других брокерских контор последовали ее примеру; так, фирма E*Trade Securities предлагает аналогичную услугу на базе системы распознавания речи с ПО фирмы Advanced Language Technology.

Помимо внедрения миллионодолларовой технологии IVR компания сформировала отдельную группу Voice Technology Group из 20 человек. По словам Хейлмана, эта группа занимается разработкой программных приложений для Voice Broker и Telebroker (IVR-системы с вводом с клавиатуры тонального номеронабирателя). Подразделение информационных технологий фирмы обеспечивает разработку ПО для хост-машин, а еще одна группа программистов занимается сетевыми и коммуникационными вопросами.

Voice Broker - один из наиболее сложных вариантов реализации технологии распознавания речи. Schwab работает более чем с 15 тыс. разновидностей ценных бумаг, а системе приходится распознавать свыше 100 тыс. видов информационных запросов, поскольку во многих случаях допускаются различные формулировки. Если, скажем, один клиент назовет интересующую его фирму “IBM”, то другой - “International Business Machines”, третий же - “Big Blue” (“Голубой гигант”), не говоря уже о разнообразии диалектных разновидностей произношения североамериканских пользователей.

Система фирмы Sears проще. Она предлагает звонящему назвать человека, с которым он хотел бы связаться, и подразделение, где тот работает, чтобы направить звонок непосредственно на индивидуальный аппарат этого сотрудника. С помощью системы UPS клиенты компании могут отслеживать передвижение бандеролей в экспресс-почте. Чтобы получить информацию о дате и времени доставки, а также имени человека, расписавшегося в получении, нужно назвать номер почтового отправления. Эта система обрабатывает около 100 тыс. звонков в день.

Стоимость ПО распознавания речи обычно зависит от объема словаря и степени точности распознавания. Простейшие системы, которые распознают слова “yes” и “no”, предлагаются по цене в несколько тысяч долларов; более сложные стоят значительно дороже. Однако даже дорогие системы могут окупаться очень быстро. Так, системы Sears и UPS оправдали затраты менее чем за полгода, а системе Schwab на это потребовалось около года.

Пилотное тестирование    

В 1994 г., когда Schwab приступила к исследованию возможностей различных средств распознавания речи, в данной области специализировалось с десяток компаний, включая как начинающие фирмы, так и крупные корпорации вроде Northern Telecom. Фирма Nuance выделялась среди них, по словам Хейлмана, способностью удовлетворить требования Schwab по скорости распознавания. Сделка была заключена, и через полтора года система Voice Broker включилась в работу, дополнив собой ранее созданную систему Telebroker.

Предназначение Voice Broker состояло в том, чтобы отвечать на запросы о котировках акций, которые поступают в количестве примерно 50 тыс. в день. “Нам было заранее известно, на какую нагрузку следует ориентировать это приложение, - говорит директор Schwab по технологиям Боб Уолсен. - Очень важным фактором была его способность справляться с пиковыми нагрузками, возникающими в рабочие часы”.

Чаще всего телефонные звонки раздаются при открытии биржи, в середине дня, а также в то время, когда происходит какое-либо значительное событие вроде слияния или неожиданного заявления о финансовых результатах той или иной компании. Система Schwab способна обрабатывать до 360 одновременно входящих звонков.

Первоначально руководство Schwab планировало использовать построенную в рамках пилотного проекта систему в течение двух недель, чтобы оценить, как люди смогут ею пользоваться и какое мнение сложится у них по этому поводу. Кроме того, нужно было выяснить, с какими словами клиенты обращаются за получением информации. Однако желающих пользоваться услугами этой системы оказалось так много, что Schwab продлила срок ее работы до шести месяцев, в течение которых собирались данные о произношении различных слов и типичных фразах. В результате удалось создать систему с точностью распознавания 95% и временем выдачи ответа менее двух секунд.

По завершении пилотного проекта система была снята с эксплуатации, а в июне 1996 г. ее место заняла промышленная версия. В марте 1997 г. Schwab и Nuance пополнили ассортимент ценных бумаг, по которым Voice Broker предоставляла сведения, опционами - это был первый случай для брокерских контор.

Предоставление информации о котировках опционов - значительно более сложное дело, чем для акций, поскольку каждый такой запрос включает большее число информационных элементов. Для получения сведений об акциях пользователю информационной системы достаточно назвать компанию; для опциона к имени компании добавляются месяц реализации, назначенная цена и тип опциона. Опционы на покупку составляют 10% от общего числа объектов телефонных обращений в справочную службу Schwab, и до последнего усовершенствования автоматической системы отвечать на них приходилось персоналу центра обработки звонков.

Конечно, быть первым всегда непросто. “Это был в полном смысле исследовательский проект, - вспоминает Уолсен. - Одна из самых больших сложностей, с которой нам пришлось столкнуться, - это заставить большое количество разных систем, включая рабочие станции с процессорами SPARC фирмы Sun Microsystems, коммутатор фирмы Cisco Systems и мэйнфрейм корпорации IBM, работать вместе без шумов в телефонной линии”.

Участие в работе по построению системы распознавания речи вместе со Schwab, Nuance и SRI Consulting (Менло-Парк, шт. Калифорния) приняла также корпорация Periphonics (Богемия, шт. Нью-Йорк), производитель систем IVR.

Теперь Schwab думает о том, чтобы ассортимент услуг дополнить предоставлением информации о текущих торгах и статистике биржи, а также о том, чтобы ослабить ограничение лексикона клиентов. Возможно и еще одно усовершенствование - использование вместо паролей идентификации по голосу. Nuance уже располагает необходимой технологией для этого.

Независимый автор из Свомпскотта (шт. Массачусетс) Лора Смит специализируется на вопросах бизнеса и технологии. С ней можно связаться по адресу: lauras@shore.net.

Случай из практики    

Организация: Charles Schwab & Co.

Штаб-квартира: Сан-Франциско.

Постановка задачи: спроектировать систему распознавания речи, с помощью которой клиенты могли бы обращаться по телефону за информацией о котировках акций, используя естественную речь вместо ввода с помощью телефонной клавиатуры.

Решение: сочетание ПО распознавания речи с системой IVR (Interactive Voice Response - интерактивная система с голосовым ответом).

Определяющий фактор успеха: точность распознавания - 95% при времени отклика в пределах двух секунд.

Главная сложность: аналоговые соединения между системой IVR и сервером распознавания речи создавали большие сложности; они заменены цифровыми соединениями.

Планы на будущее: возможно внедрение технологии идентификации собеседника по голосу вместо применяемой в настоящее время системы паролей; использование готовых программных модулей для ускорения дальнейшей разработки.

ИНСТРУМЕНТАРИЙ

Система IVR: разработка фирмы Periphonics. Включает модуль распознавания голоса (Voice Recognition Unit, VRU) - главный прикладной интерфейс, исполняемый на рабочей станции с процессором SPARC фирмы Sun. Этот модуль взаимодействует с несколькими блоками распознавания на машинах UltraSPARC, которые обеспечивают VRU запрошенной информацией.

ПО распознавания речи: разработка фирмы Nuance Communications на базе технологии Conversational Transaction Technology.

Другое оборудование: коммутатор фирмы Cisco; мэйнфрейм корпорации IBM, на котором хранится БД с информацией о пользователях.