На пути к ”Чаше Грааля” распознавания слитной речи - еще годы работы
Все понимают, что технологию распознавания слитной речи ждет большое будущее, только вряд ли то же самое можно сказать о нынешних продуктах, предлагаемых в качестве решения этой задачи.
Интервью PC Week Labs с Реем Курцвайлем можно
услышать, посетив Web-страницу: www.pcweek.com/link/0302
Приемлемая точность распознавания речи должна составлять не менее 95%. Точность продуктов, испытанных в Тестовом центре PC Week Labs, была близка к этой цифре, однако даже при этом исправление допущенных ошибок требовало ощутимых затрат времени. Данная проблема будет снята, когда точность распознавания речи превысит 99%, но произойдет это не раньше, чем через несколько лет.
Рей Курцвайль, основатель фирмы Kurzweil Applied Intelligence, специализирующейся в области синтеза речи и звука, и главный технический руководитель компании Lernout & Hauspie Speech Products USA, которая в 1997 г. купила его фирму, в своем интервью PC Week Labs заявил, что общедоступные средства распознавания естественной слитной речи, не зависящие от голоса говорящего, - это “Чаша Грааля” и до нее еще около пяти лет трудного пути.
Оценка, данная Курцвайлем, выглядит вполне реалистичной. С появлением мощных компьютеров с тактовой частотой на уровне 1 ГГц, можно будет использовать более сложные алгоритмы распознавания речи, и тогда программы, воспринимающие диктуемый текст, станут более гибкими и удобными для человека.
Продукты фирм Dragon Systems и Lernout & Hauspie Speech Products USA, испытанные в PC Week Shoot-Out, показали, что технологии распознавания диктуемого текста можно будет внедрить в такие приложения, как электронные записные книжки, электронная почта и офисные пакеты. Dragon совместно с фирмой Actioneer собирается включить эту технологию в продукты типа персональных менеджеров информации, которые должны появиться уже в этом году. Lernout & Hauspie планирует внедрить свою технологию распознавания речи в Web-браузеры, средства поиска в Internet и базах данных, а также в электронную почту.
Мы считаем, что такие продукты являются пока что наилучшим способом соединения человеческой речи с обычными формами работы за компьютером. Курцвайль говорил также о телефонии с почти синхронным переводом, которая позволит, с небольшой задержкой во времени, переводить речь с одного языка на другой. Он надеется, что такое устройство может быть создано в его фирме в ближайшие два года.