KYOCERA Capture Manager (KCM) — комплексное решение, предназначенное для ускорения и удешевления процедуры цифровой трансформации. Не просто приложение, способствующее глубокому анализу неструктурированных данных, но система, которая опирается на возможности всех присутствующих в локальной сети организации аппаратных средств перевода «бумажной» информации в цифровой вид. Об особенностях этого ПО, о специфике его применения и обширном потенциале рассказывает Сергей Свистунов, пресейл-менеджер KYOCERA Document Solutions Russia.
Насколько доступно для заказчиков оборудования KYOCERA решение Capture Manager? В чём разница между КСМ и КСМ Professional, если рассматривать функциональные возможности, уровень поддержки и цену?
Есть две версии KCM — Lite и Pro. Различаются они весьма существенно. Lite нацелена на малый и средний бизнес, предполагает сканирование до тысячи страниц в месяц и располагает только необходимой функциональностью. Версия же Professional рассчитана на большие объёмы сканирования, для лучшей поддержки кириллицы в ней используется модуль распознавания текста от ABBYY, и заказчику здесь открыты все возможности. Детальное сравнение двух версий доступно по запросу. В любом случае и та и другая получают полноценную техническую поддержку, а точная цена решения зависит от широты спектра выбранных функций: система очень гибкая.
Интерфейс KYOCERA Capture Manager логичен, прост и предоставляет администратору широчайший инструментарий для управления документооборотом
Как реализовано отождествление типа оцифрованного документа в KYOCERA Capture Manager? Какие аппаратные ресурсы требуются для работы этого сервиса, сложно ли его настраивать и администрировать?
Изначально в KCM создаются шаблоны, и при получении документа система пытается определить, какому шаблону он соответствует. Затем запускается распознавание текста, деление его по зонам, обработка и пересылка. Этот процесс выполняется на сервере, который содержит в себе все сервисы KCM и обеспечивает бесперебойную работу решения.
В рамках контракта могут быть выстроены различные режимы взаимодействия и поддержки работоспособности системы. Так, KCM может полностью поддерживаться провайдером услуг или же передаваться в ИT-отдел заказчика под его ответственность.
Как происходит обучение системы КСМ во время настройки, когда исходный документ и его структурированная версия направляются живому сотруднику для выявления и коррекции возможных ошибок? Необходима ли такая процедура всякий раз при первом запуске КСМ на предприятии? И если нет, то каким образом совершенствуются «вшитые» в систему алгоритмы отождествления и распознавания?
Документы до оцифровки могут пройти через огонь, воду и медные трубы. Такой документ сложно будет обработать системе, которая была настроена на работу с чистенькими целыми формами, заполненными каллиграфическим почерком.
Поэтому очень важно с самого начала предоставить системе весь спектр возможных документов, которые впоследствии будут попадать на её вход. Это позволит снизить количество нераспознанных документов до минимума, а выявленные исключения позволят специалистам улучшить алгоритмы работы KCM с данным типом документации.
С какими разновидностями цифровых документов приходится иметь дело КСМ? Какие из них сложнее всего поддаются распознаванию и структурированию? Можете ли вы припомнить из реальной практики применения решения какие-то наиболее редкие, выдающиеся случаи отъявленно неструктурированных данных, с распознаванием которых удалось корректно справиться?
Самые сложные случаи обычно связаны с рукописным текстом — и в целом с человеческим фактором. Например, люди ставят подпись в документе не там, где для неё предусмотрено место, а где-то сбоку листа. Или почему-то присылают форму, которую перед заполнением явно пару раз переправляли по факсу, в ходе чего она приобрела сюрреалистическое содержание.
Проблемы с распознаванием текста — наиболее сложный момент в работе таких систем. На данном этапе развития алгоритмов OCR невозможно полностью полагаться на полученные с их помощью оцифрованные данные. Это означает, что в целом информация из бумажного документа наверняка извлечена верно, но сразу же использовать её как ключ для поиска в базе данных нельзя.
В тех случаях, когда необходима однозначная идентификация, используются одномерные штрихкоды или же двумерные QR-коды. Они предусматривают контрольную сумму и избыточность кодирования информации, благодаря чему она сохраняется даже после пересылки по факсу.
Расскажите подробнее о сводах правил, в соответствии с которыми КСМ направляет обработанный документ тому или иному сотруднику. Кто формирует эти правила, кто имеет полномочия их менять, как обеспечивается конфиденциальность переправляемых уполномоченным сотрудникам данных?
Как только система обработает поступивший документ, начинается этап пересылки результата — оцифрованного, структурированного документа — в соответствии с программой. На этом этапе KCM уже обладает всей полнотой информации, чтобы принимать адекватные решения о дальнейших действиях.
Насколько чаще в последнее время, по вашему опыту, российские заказчики стремятся приобретать не разрозненные принтеры и МФУ, а полноценное связное решение для упорядочения своего документооборота?
Я могу высказать только свои собственные ощущения. Судя по ним, интерес к системам управления печатью, сканированием и к системам электронного документооборота растёт в геометрической прогрессии. Наблюдается перелом в сознании пользователей: сегодня они воспринимают МФУ не как отдельное устройство, а как интегральный элемент большой системы для работы с документами внутри компании. Это схоже с тем, как менялось наше отношение к телефону — от устройства, пригодного лишь для голосовой связи с другим человеком, до универсального коммуникационного терминала, через который мы получаем доступ ко всей глобальной инфраструктуре. То же самое теперь верно и для многофункциональных устройств KYOCERA!
Другие статьи раздела «Программное обеспечение KYOCERA»
СПЕЦПРОЕКТ КОМПАНИИ KYOCERA