Святой Грааль разработчиков ПО распознавания речи - оцифровка слитной диктовки - наконец, судя по всему, найден. Сия святыня, однако, оказалась погребена под такой грудой ОЗУ, что пользователи скептически относятся к возможности ее практического использования.
Корпорация IBM анонсировала ViaVoice - свой первый универсальный пакет распознавания слитной речи в процессе диктовки, разработанный в подразделении Speech Business Unit (Уэст-Палм-Бич, шт. Флорида). Его цена ($199) значительно ниже, чем у единственного конкурирующего продукта NaturallySpeaking фирмы Dragon Systems (который предлагается за $695); при этом какого-либо серьезного различия в их возможностях не отмечается.
ViaVoice комплектуется словарем из 25 тыс. слов (NaturallySpeaking - из 30 тыс.), допускающим расширение до 230 тыс. слов. Согласно информации производителей, обе системы предполагают необходимость предварительного обучения пользователей.
Выпущенное в начале этого года ПО Naturally-Speaking фирмы Dragon стало самой первой коммерчески доступной системой распознавания слитной речи.
NaturallySpeaking и ViaVoice требуют для работы не менее 32 Мб ОЗУ, а под управлением ОС Windows NT - не менее 48 Мб. Для многих пользователей, за исключением наиболее технически оснащенных, это тяжелое условие.
Помимо технологических ограничений, скептицизм в отношении ПО распознавания слитной речи питают также и недоразумения культурного плана. Недостаточно знакомые с реальностью пользователи представляют себе функционирование ПО, основываясь на том, что видели в фильмах вроде “Star Trek”, считает ведущий специалист консультационной фирмы Wohl Associates (Нарберт, шт. Пенсильвания) Эми Вул.
Кроме того, по ее мнению, даже реально возможное повышение производительности достигается не сразу, хотя и подтверждается недавними исследованиями.
В среднем машинистка набивает 80 слов в минуту, а диктовка с использованием ПО распознавания слитной речи позволяет достичь скорости 150 слов в минуту. Пользователи предварительных версий ViaVoice отметили это повышение.
“По нашей субъективной оценке, программа экономит около 25% рабочего времени сотрудника, - говорит Кристин Кесслер, директор-распорядитель фирмы Maynard, O’Connor, Smith et. al. (Олбани, шт. Нью-Йорк). - Благодаря этой экономии наши секретари могут выступать больше в роли помощника юриста, а не растрачивать свои силы на низкоквалифицированную работу”.
По словам Кесслер, из 17 пользователей системы ViaVoice в ее компании только один-два чувствуют себя с ней некомфортно; однако, добавила она, эти люди вообще мало имели дело с компьютером.
Начало коммерческого распространения ViaVoice намечено на август. Редакция Gold, выпуск которой планируется на конец года, будет дополнена функциями управления компьютером и, возможно, в ней будет увеличен объем словаря. По сведениям, полученным от представителей производителя, цена на следующую версию пока не установлена.
Телефон московского представительства IBM:
(095) 940-2000, адрес: www.ibm.com.
Скотт Беринато