За повседневным шелестом кулеров, незримой работой процессоров и скрипом скроллинга на мышке мы не замечаем, как меняет свое лицо Интернет. Количество денег, технологий и человеко-часов, затрачиваемых на разработку новых приложений, растет день ото дня. Вроде бы совсем недавно появились видеоархивы, а сегодня видеоассистенты вживую рассказывают на веб-страницах о достоинствах товаров и услуг. Давно ли мы удивлялись звуковым обращениям владельцев сайтов к своим посетителям, а теперь вот зарождается новый формат — “голосовой” веб, и следом идут технологии, основанные на ультразвуке.
Активным промоутером и идеологом новой технологии “голосового” веба (Spoken Web) стала корпорация IBM. Как сообщает её пресс-служба, компания ведет разработки в области “голосового” Интернета, чтобы сделать информацию доступной для тех пользователей, которые не могут читать, писать или же не имеют доступа в Сеть. При этом в расчет берутся не только и не столько люди с физическими дефектами, сколько прежде всего те, кто по роду своей деятельности или в силу обстоятельств не может находиться в определенный момент времени за экраном монитора, но нуждается в интернет-доступе (путешественники, фермеры, водители и т. д.). Более того, “голосовой” веб при определенной популярности может де-факто стать новым стандартом взаимодействия с различными интернет-сервисами, превратив манипуляторы и клавиатуру в анахронизм.
Еще в апреле этого года IBM объявила о разработке голосового браузера, управление которым происходит исключительно голосовыми командами. Программа позволяет набирать URL-адреса, переходить по ссылкам и перемещаться по странице исключительно посредством голоса. По представлениям IBM подобная программа будет незаменима для мобильных средств доступа в Интернет, таких как мобильные телефоны, смартфоны, органайзеры и т. п. Как полагают в корпорации, число пользователей, соединяющихся с Интернетом посредством мобильных устройств, к 2011 году достигнет миллиарда. “Сегодня используется примерно 2,6 миллиарда сотовых телефонов, а население мира составляет 6 миллиардов человек; значит, остается по крайней мере три миллиарда тех, кому еще нужны сотовые телефоны”, — говорит Пол Блум, исполнительный директор отдела коммуникаций IBM. Но, по его словам, многие потребители, в частности в развивающихся странах, хотят получить что-то большее, чем просто телефон. Так что рынок имеет многомиллиардный потенциал, и IBM не может отказаться от своей доли на нём. У IBM есть порядка сотни исследователей и восемь лабораторий, которые ведут разработки в области связи. Одна из них, India Research Laboratory, расположенная в Нью-Дели (Индия), как раз и занимается созданием Spoken Web.
В основе “голосового” веба используются VoiceXML (Voice eXtensible Markup Language) и HSTP (Hyper Speech Transfer Protocol). Совместно с рядом индийских провайдеров мобильной связи IBM уже приступила к пилотному тестированию этой технологии. Структура Spoken Web аналогична World Wide Web с той лишь разницей, что узлы сети образуют “Voice-сайты” со своими собственными адресами, с которыми связаны “Voice-ссылки”.
Восьмого августа этого года консорциум W3C анонсировал уже третью версию спецификации VoiceXML, специально предназначенную для организации звуковых диалогов, синтеза речи, чтения текстов, записи разговоров, телефонии и т. п. Эта спецификация создана на базе стандарта XML 1.0 и теперь будет подана в соответствующие органы для последующего утверждения в качестве промышленного стандарта. Форум Voice XML, членами-основателями которого являются компании AT&T, IBM, Lucent, Motorola, образовался в 1999-м. На сегодня в работе по созданию нового стандарта приняло участие 75 компаний.
Стоит отметить, что идея “голосового” веба не нова. Ещё 11 апреля 2006 года Бюро патентов и торговых марок США выдало Google патент за номером 7.027.987 с описанием “системы, представляющей поисковые результаты по голосовым запросам”. Следует упомянуть, что не только Google и IBM занимаются подобной деятельностью. Например, над преобразованием голоса в текст работают компании VoiceSignal и V-ENABLE. Работа фирмы Promptu также связана с голосовым поиском в мобильных телефонах. AgileTV разрабатывает программное обеспечение распознавания речи, главным образом для телепоиска. В настоящее время подобной деятельностью занимается и Microsoft. И надо полагать, если такие софтверные гиганты серьёзно взялись за эту идею, то рано или поздно она будет воплощена в жизнь.
Еще дальше в своих новациях пошли японцы, решившие “оживить” виртуальную реальность путем создания тактильного дисплея (Airborne Ultrasound Tactile Display). Они предлагают отказаться от всяких перчаток, 3D-очков и прочей визуализирующей техники, поскольку она не способна передать чувства от прикосновения к предмету. Группа ученых во главе с Такаюки Ивамото сумела использовать для этой цели сфокусированный ультразвук. Ультразвук -- это звуковые волны частотой более 20 кГц, способные сжимать определенные участки воздуха в фокусе; а значит, сумев сфокусировать несколько ультразвуковых волн, можно получить в фокальной точке некое “сгущение”, вполне ощутимое на ощупь.
Суть устройства сводится к взаимодействию специального внешнего ультразвукового устройства, состоящего из нескольких ультразвуковых излучателей, и программы, которая через видеокамеру, соединенную с компьютером, отслеживает движение руки пользователя и позволяет смещать фокальную точку генераторов ультразвука. В результате создается ощущение, будто ладонь движется по поверхности объекта. Ученым уже удалось построить ультразвуковую вертикальную проекцию, и они заявляют, что доработать прототип — это дело времени. Тем более что они получили уже несколько предложений от производителей, готовых финансировать их разработку. Пока же проведены испытания, демонстрационный ролик которых выложен во многих видеоархивах.
Действительно, с распространением современных мультимедийных технологий мы все шире используем зрение и слух, общаясь с компьютером и приложениями. И все же тактильная информация по-прежнему остается “за бортом” этого процесса. Тем соблазнительней для производителей периферийных устройств создать устройство, которое сможет в полной мере использовать осязание. И надо полагать, следом за осязанием к процессу реализации виртуального мира ученые будут добавлять и другие человеческие чувства.