Специалисты компании «Диджитал Дизайн» совместно с профессором кафедры технологии программирования СПбГУ и группой студентов университета провели исследование возможности применения в системах электронного документооборота алгоритмов машинного обучения.
Цель исследования — проверить возможность использования в СЭД интеллектуальных алгоритмов, повторяющих принципы нейронной сети. Основные задачи такой «сети» — определение категории документа, автоматическое заполнение его основных атрибутов, определение, на основании анализа текста прикрепленного файла, наиболее вероятных исполнителей и создание для них проектов текстов поручений.
Объектом исследования стала система электронного документооборота Правительства Мурманской области, которую компания «Диджитал Дизайн» сопровождает с 2009 года. В качестве базы данных были использованы обезличенные тексты более 250 тысяч входящих и исходящих документов служебной переписки.
По результатам исследования определено, что при использовании интеллектуальных алгоритмов возможна автоматизация сортировки документов по содержимому прикрепленных файлов и составления семантического ядра для каждой категории, поиска схожих или идентичных документов, определения зависимости одних атрибутов документа от других и даже автоматизация построения вероятностной модели предсказания значений атрибутов.
«В ходе исследования удалось достигнуть 95% точности определения категории документа по содержанию текста», — сообщил Дмитрий Пеккер, руководитель проекта со стороны «Диджитал Дизайн».
Результаты исследования компания предложит Правительству Мурманской области для внедрения автоматизации обработки входящих и исходящих документов.
Тимур Лапин, председатель Комитета по развитию информационных технологий и связи Мурманской области, убежден, что внедрение новых интеллектуальных технологий позволит упростить выполнение рутинных операций при обработке документов и существенно сократит непроизводительные затраты специалистов исполнительных органов государственной власти Мурманской области при исполнении поручений.
На следующем этапе исследуемого решения будет проведено тестирование на узкой группе ключевых пользователей системы электронного документооборота Правительства Мурманской области, обрабатывающих большие объемы документов.