Компания ABBYY объявила о выходе новой версии инструментария разработчика (SDK) ABBYY FineReader Engine 10. Новинка предназначена для встраивания функций оптического распознавания текста в приложения независимых разработчиков. Сообщается, что по сравнению с предыдущей версией SDK в новом продукте имеется ряд существенных улучшений: увеличена скорость распознавания и повышено его качество, а интеграция технологий стала ещё удобнее и проще.
Создатели новинки утверждают, что теперь ABBYY FineReader Engine обрабатывает тексты на русском языке на 44% быстрее, а скорость распознавания для основных европейских языков (английский, немецкий, французский, итальянский, испанский) увеличена почти в два раза.
Кроме того, для удобства разработчиков в ABBYY FineReader Engine 10 расширены возможности API (интерфейс прикладного программирования). Теперь в процессе создания собственного приложения разработчики могут воспользоваться специальными профилями, настроенными для решения ряда типовых задач, таких как конвертация документов для сохранения в архиве, преобразование документов для их последующего редактирования, извлечение опорного текста, штрихкодов или меток.
Новая версия SDK предоставляет широкие возможности по работе с файлами формата PDF (в том числе PDF/A для архивного хранения). К примеру, ABBYY FineReader Engine 10 предлагает пользователю ряд режимов сохранения, среди которых он может выбрать оптимальный: режим наилучшего качества, максимальной скорости, с минимальным размером файла или сбалансированный режим. Кроме того, ABBYY FineReader Engine 10 позволяет создавать PDF-файлы с ультравысоким сжатием MRC (Mixed Raster Content), в результате которого визуальные характеристики документа не страдают.
Среди ключевых возможностей ABBYY FineReader Engine 10 можно также отметить следующие:
- поддержка 198 языков распознавания (нет аналогов в мире);
- поддержка многоязычных документов;
- специальные функции для обработки фотографий в документах;
- распознавание более 15 видов одномерных и основных двумерных штрихкодов.
А еще в ABBYY FineReader Engine 10 улучшена технология адаптивного распознавания документов (ADRT), с помощью которой SDK сохраняет структуру многостраничного документа, обрабатывая его как единое целое. Версия ADRT 2.0 выделяет не только такие элементы структуры, как колонтитулы, сноски, нумерацию страниц и заголовков, подписи картинок и графиков, но и восстанавливает оглавление документа, стили шрифтов и заголовков.