За день до торжественного открытия SofTool'а — главной ежегодной софтверной выставки Роcсии, cостоявшейся в нынешнем году уже в 18-й раз, —группа ABBYY представила семейство продуктов FineReader 9.0. По словам разработчиков, при его создании они руководствовались девизом “От распознавания отдельных страниц — к распознаванию документа в целом”.
Объявление “девятки” произошло через два года после анонсирования ABBYY FineReader 8.0 (www.pcweek.ru/themes/detail.php?ID=71079) и через четыре — после представления “Великолепной семёрки” (www.pcweek.ru/themes/detail.php?ID=65216). Чем же “девятка” — при той же рекомендованной цене — лучше своих предшественниц? Вот как отвечает на этот вопрос руководитель службы продуктового маркетинга “ABBYY Россия” Дина Шелепина: “Многие годы производители OCR-продуктов ставили перед собой задачу качественного распознавания символов, слов, фраз и отдельных страниц и достигли в этом высоких результатов. В настоящее время, чтобы лучше соответствовать ожиданиям и потребностям пользователей, перед разработчиками встала новая задача — качественного анализа и распознавания документа как единого целостного объекта. Около пяти лет назад компания ABBYY впервые задумалась над подобной задачей и теперь вплотную подошла к её решению, разработав технологию ADRT (Adaptive Document Recognition Technology), которая осуществляет выделение, сопоставление и поиск соответствий таких элементов логической структуры документа, как колонтитулы, сноски, подписи к картинкам и диаграммам, стили, шрифты, нумерация страниц. Это позволяет проводить анализ документа как единого объекта. Данная технология и легла в основу системы распознавания документов и PDF-файлов ABBYY FineReader 9.0”.
“Да, мы считаем, что переход от постраничного распознавания документов к их анализу и восприятию как единого целого является важным этапом развития OCR-систем. Технология ADRT, над развитием которой мы работаем последние несколько лет, позволяет FineReader´у определять многие элементы логической структуры документа. Так, если раньше, при постраничном анализе документа, параграф или таблица, разнесённые на две страницы, передавались в выходной документ как два параграфа или две таблицы, то FineReader 9.0 позволяет объединить разбитые по разным страницам абзацы или таблицы в один объект даже в том случае, если страница имеет колонтитулы или сноски”, — добавляет генеральный директор “ABBYY Россия” Григорий Липич.
По данным внутренних тестов компании-разработчика, в ABBYY FineReader 9.0 по сравнению с “восьмёркой” точность соблюдения оформления договоров и юридических документов улучшена на 19%, книг — на 22%, газет и журналов — на 32%. По словам г-на Липича, эти показатели получены в результате обработки результатов распознавания тысяч тестовых страниц.
Как известно, многие офисные документы, особенно юридические и бухгалтерские, содержат подписи генеральных или финансовых директоров и других ответственных лиц компании. При преобразовании такого бумажного документа в Word-файл необходимо, чтобы эти подписи сохранили свой первоначальный вид. Раньше все эти подписи приходилось выделять вручную, что занимало достаточно много времени. Теперь же FineReader 9.0 при анализе документа автоматически определяет месторасположение подписей и выделяет каждую область с подписью как картинку, не пытается её “распознавать”, а сохраняет идентичной оригиналу на бумаге.
Ещё одно приятное нововведение: теперь пользователю не нужно думать о выборе языка распознавания (FineReader 9.0, как и его предшественник, понимает 179 языков, обеспечивая для 36 из них словарную поддержку). Новинка, используя встроенные в неё интеллектуальные алгоритмы, сама определяет, на каких языках распознаваемый документ написан.
По многочисленным просьбам пользователей, ABBYY FineReader 9.0 обеспечивает сохранение документов в стандарте PDF/A, рекомендуемом международными организациями для создания электронных архивов, рассчитанных “на века”. Этот стандарт жёстче обычного PDF, но сохраняемые в нём документы могут быть прочитаны более широким спектром инструментов, разработанных для различных операционных систем и платформ.
Ну и разумеется, разработчики программ cемейства ABBYY FineReader 9.0 позаботились об их совместимости с новейшими технологическими новинками Microsoft — продукты прошли cоответствующую сертификацию и получили логотип “Certified for Windows Vista”.
Любое прикладное ПО характеризуется не только ценой и функциональностью, но и такими важными параметрами, как быстродействие и потребление ресурсов. Разработчики говорят, что не проводили специальных тестов по сравнению быстродействий “восьмёрки” и “девятки” на различных одноядерных процессорах. В том числе потому, что слишком много факторов — от конфигурации компьютера до логической структуры и объёма распознаваемого документа — влияют на это самое быстродействие. Тем не менее они утверждают, что на двухъядерных процессорах новинка работает в среднем в 1,6 раза быстрее, чем на одноядерных, а на четырехъядерных процессорах быстродействие по сравнению с одноядерными повышается примерно в 3,2 раза. Причина проста: алгоритмы распознавания достаточно легко распараллеливаются, а само семейство FineReader 9.0 как раз и создавалось в расчёте на перспективные процессоры.
Автор этих строк, располагая некоторой базой не очень сложных по структуре PDF-документов, провёл сравнительное экспресс-тестирование “восьмёрки” и “девятки” с помощью домашнего настольного компьютера, выполненного на базе 2,66-Гц одноядерного процессора Intel Celeron, имеющего 512 Мб ОЗУ и работающего под управлением ОС Windows XP Home Edition SP2. Результаты обработки этих документов показали, что быстродействие FineReader 9.0 не намного ниже аналогичного показателя версии-предшественницы, а точность соблюдения оформления документов в новинке, как и было обещано, действительно лучше, чем в “восьмёрке”. Хотя до 100% эта точность, конечно, ещё не дотягивает (во многих случаях “девятка” cтремится распознать не только чёрно-белые, но и явно выраженные цветные иллюстрации). То есть поле для совершенствования у разработчиков ещё есть.
В каналы продаж семейство FineReader 9.0 будет поставляться в двух версиях: FineReader 9.0 Professional Edition (профессиональный продукт для индивидуальных пользователей и небольших фирм) и FineReader 9.0 Corporate Edition (продукт, ориентированный на компании любого размера и оптимизированный для работы в корпоративной сети). Рекомендованная цена первого пакета составит 3750 руб., второго — 7500 руб. Пользователи предыдущих версий этих пакетов могут приобрести данные продукты с 40%-ной скидкой. По словам Дины Шелепиной, продажи пакета ABBYY FineReader 9.0 Professional Edition начнутся в октябре, а ABBYY FineReader 9.0 Corporate Edition — чуть позже, но до конца 2007 г.
*Кроме деловых версий пакета ABBYY FineReader 7.0 (Professional Edition и Corporate Edition) выпускались ещё домашние версии этого продукта(Home Editition). В семействе 8.0 домашних версий не было.