Непосредственным поводом к написанию этой статьи послужила публикация в PC Week/RE, № 5/96 "О качестве распознавания печатных текстов", в которой Михаилом Донским был обоснован следующий тезис (цитирую): "...качество распознавания (в определенных пределах) никакого значения не имеет".

 

Вообще-то несложно доказать абсолютно любой тезис, представленный в такой форме. Например: "Притяжение Земли (в определенных пределах) никакого значения не имеет". Или: "Женская привлекательность (в определенных пределах) никакого значения не имеет".

 

Более того, если в упомянутой публикации заменить слова "распознавание печатных текстов" словами "компьютер" или "Windows 95", а слова "корректность распознавания" словами "автоматизация производственного процесса" или "удовлетворенность клиента", получится достаточно читабельная статья на любую другую тему, например: "Об удовлетворенности заказчика". Она будет содержать абсолютно правильные мысли типа: "Сама по себе Windows 95 не нужна. Она нужна как часть какой-то практической задачи..." и "...ни один компьютер не может гарантировать автоматизацию производственного процесса целиком..."

 

Я мог бы продолжать в том же духе, но это будет неконструктивно. Скажу честно  -  меня как компьютерного журналиста, специализирующегося на программном обеспечении, конечно, задел пренебрежительный тон, которым автор статьи помянул работу тестовой лаборатории журнала "Мир ПК". Но дело не в этом.

 

Мне известно, что М. Донской не только высококвалифицированный и авторитетный разработчик программного обеспечения, но и человек, тесно связанный с разработками программ для распознавания текстов. Кроме того, будучи автором многочисленных публикаций, он, вероятно, достаточно сведущ в издательском деле. Когда такой человек говорит, что качество распознавания (в определенных пределах) никакого значения не имеет, ожидаешь от него солидной аргументации.

 

Что же он пишет? "...качество распознавания, чем бы оно ни мерилось, практического значения не имеет при условии, что оно выше некоторого критического порога  -  около 90%". Вот пример текста, считанного с качеством 90%, если его измерять в корректно распознанных символах: "По мсему миению, качеотво распо3навания, чем 6ы о1ю ни мерипось, практичеокого зиачения не иыеет при условни, что о1ю выже некоторого критичеокого пфога  -  около 9()/". Работать с таким текстом, конечно, нельзя. М. Донскому наверняка известны как промышленные требования к системам OCR (99,0 - 99,5%), так и требования к профессиональной машинописи (99,9%). Причем разница между 90 и 95% едва заметна, между 99,0 и 99,5%  -  весьма ощутима, а между 99,5 и 99,9%  -  просто колоссальна. Зачем же основывать и без того спорное утверждение на заведомо абсурдной цифре 90%?

 

Далее автор приводит пример с вводом большого объема текста. "Что лучше в этом случае  -  одна ошибка на страницу или пять? По-моему, пять. Ведь любой корректор знает, что, если ошибок немного, но они более или менее регулярны, исправлять текст легче, чем если ошибки в нем случайны и редки, потому что теряется внимание". На самом деле любой корректор знает, что дело обстоит в точности наоборот. Чем больше ошибок, тем больше вероятность "зевнуть", а если ошибки "случайны и редки" (текст хорошо распознан и обработан спел-чекером), то внимание  -  профессиональная черта корректоров  -  автоматически обостряется. Почему автор, зная проблему, судит с позиции дилетанта?

 

Второй пример, использованный М. Донским,  -  автоматическая обработка денежных переводов. "Мне бы... хотелось, чтобы программа распознавания делила переводы на две группы, в одну из которых попадали бы переводы на небольшую сумму, распознанные достоверно, а в другую  -  все остальные для отправки их потом на ручную обработку". Но "...ни одна программа распознавания не может гарантировать корректность распознавания документа целиком... Поэтому руководитель почтового ведомства обязан включать в технологический цикл ручную проверку всех переводов". Забавно, что автор этих слов наверняка лучше меня знает методы гарантирования корректности распознавания. Вот только один из них  -  если необходимо обеспечить достоверность распознавания суммы перевода, система считывает и независимо распознает соответствующее число не один раз, а, например, восемь. Если восемь результатов совпали, сумма распознана достоверно, вероятность ошибки в данном случае меньше, чем при ручном вводе.

 

Будучи экспертом в области взаимодействия "человек  -  машина", М. Донской абсолютно справедливо пишет: "...важнее самого распознавания (повторяю, при условии, что оно выше критического порога) становится пользовательский интерфейс..." Прекрасная идея, наш последний обзор систем OCR ("Сканеры и OCR". "КомпьютерПресс", № 9/95) был построен именно на ней. Но зачем мой коллега посвятил целых два абзаца обсуждению того, что в системах OCR "больше половины экрана занимает изображение исходного материала"? Вместо комментариев я привожу рабочий экран используемой мною системы распознавания. Конкурирующая с ней система тоже никогда не грешила "узким полем основного зрения", а классическая OCR AUTOR фирмы OCRUS, помнится, и вовсе не отображала исходный графический материал в режиме коррекции.

 

Рабочий экран OCR-системы

Я с удовольствием согласился бы с М. Донским в том, что "разумным критерием распознавания может служить общее время подготовки одного документа, в которое, кроме времени распознавания, должно включаться время верификации и исправления ошибок". Но знаете ли вы, из чего складывается это самое "общее время", например, в издательской деятельности (раз уж мы заговорили о корректорах)?

 

В старых добрых советских издательствах рукопись, полученная от автора, заново перепечатывалась машинисткой. Ошибки машинистки исправлял младший редактор. Технический редактор размечал рукопись для верстки, после чего наборщик набирал текст на линотипе. Верстку читал корректор, а после внесения исправлений макет повторно читал другой корректор. Потом макет еще раз читали автор и редактор, а до подписания в печать еще раз сверяли редактор и корректор. Именно так в прежние времена выпускались книги и периодические издания без единой ошибки.

 

Машинистку теперь заменяет автор рукописи или система распознавания, младшего редактора  -  программа проверки орфографии, функции технического редактора и наборщика как бы совмещает оператор компьютерной верстки. Но без многократной вычитки и сверки текста разными людьми избавиться от ошибок невозможно! М. Донской совершенно справедливо заметил, что "вычитывание текста... является необходимым и самым трудоемким звеном технологической цепочки", упустив, однако, из виду, что это еще и самое времяемкое звено.

 

Так что экономия времени за счет распознавания текста в масштабе издательства как раз малоощутима. Роль систем OCR в другом  -  они позволяют изменить и осовременить технологический цикл издательства, убрав из него рутинный труд многочисленных машинисток. При этом качественное распознавание ощутимо помогает корректорам. Вот только время издательского цикла теперь экономится, к сожалению, на самой корректуре  -  ее зачастую просто нет. Именно поэтому в современных изданиях так много ошибок.

 

Что же касается "общего времени подготовки одного документа" в рамках индивидуального пользователя или при взаимоотношениях "начальник - секретарь"... Попробуйте предложить любому, кто уже использует системы OCR в своей повседневной деятельности, вернуться к вводу текста с клавиатуры. Если у вас это получится, попробуйте продолжить эксперимент и предложите ему отказаться от приложений Windows в пользу DOS-программ. Хотя что особенно мелочиться  -  раз на то пошло, вы наверняка сможете обосновать и полную ненужность компьютеров как таковых. Только обязательно напишите об этом в рубрику "Мнения".

 

Камилл Ахметов

Версия для печати