Владимир Митин
2 апреля отечественная компания ABBYY Software House (ранее - BIT Software) в гостинице “Олимпик-Пента Ренессанс” впервые представила в России семейство систем оптического распознавания символов FineReader 4.0, в которое входят следующие программы:
- разнообразные OEM-версии FineReader Light (предназначены для поставки с конкретными видами сканеров или многофункциональных устройств);
- FineReader Standard (рекомендованная цена - $200, пакетный режим работы, модуль обучения новым символам и т. д.);
- FineReader Professional ($400, автоматизированный ввод таблиц и форм в базы данных, режим клиент-сервер, распознает штрих-коды и т. д.);
- FineReader Рукопись ($1600, распознает отдельно стоящие рукописные буквы и цифры, при наличии хорошего “железа” способна за 24 ч прочитать 140 тыс. страниц);
- FineReader Банк ($3200, распознает платежные поручения старого и нового образца со скоростью до 100 тыс. документов в сутки);
- FineReader Toolkit - инструментарий разработчика для встраивания FineReader в другие системы. Позволяет управлять программой распознавания символов из внешнего приложения. Содержит ядро системы FineReader, доступное в виде динамически загружаемых библиотек (DLL), которые могут быть связаны с внешним приложением через 32-разрядный API-интерфейс).
Давид Ян: “Возможность успешного выхода на
международный рынок мы осознали не так давно”
Эти программы имеют еще более высокую точность распознавания (по утверждению разработчиков, она повысилась на 60%), понимают 40 языков, распознают рукописные печатные буквы и цифры, платежные поручения нового образца, реализуют фоновое распознавание, поддерживают многопроцессорные системы, выполненные на базе Intel’овской архитектуры.
Для 11 из 40 языков (британский и американский английский, стандартный и бельгийский голландский, датский, итальянский, испанский, немецкий, русский, украинский и французский) вместе с FineReader поставляется полнофункциональная мультиязычная система коррекции орфографии Lingvo Corrector, которая позволяет в пределах одного листа проверять орфографию одновременно нескольких языков.
За чьи кошельки борется ABBYY?
В мае прошлого года, демонстрируя новое поколение оригинальных электронных словарей (см. PC Week/RE, № 21/97, c. 8), Давид Ян, президент и один из основателей компании ABBYY, невзначай обронил такую фразу: “Мы практически перестали совершенствовать FineReader, поскольку она и так почти на порядок лучше, чем системы распознавания, предложенные ближайшими конкурентами”. Эти слова почему-то запали мне в душу, и я напомнил их г-ну Яну, после того как в гостинице “Олимпик-Пента Ренессанс” завершилась грандиозная (было приглашено 600 человек из 425 организаций!) презентация программы FineReader 4.0.
“Зачем было вкладывать немалые деньги в повышение точности распознавания, если конкуренты и так достаточно далеко?” - спросил я. “Это разработчики русскоязычных "распознавалок" далеко, а изготовители OCR, ориентированных в первую очередь на понимание латиницы, находятся значительно ближе, - не моргнув глазом, ответил Давид Ян. - Но теперь по многим параметрам мы и их превосходим, что и отметил американский PC Magazine в своем январском выпуске. К сожалению, возможность успешного выхода на мировой рынок мы осознали не так давно. И этому в немалой степени способствовали результаты тестов, проведенных нашими зарубежными партнерами и рядом авторитетных изданий. Кроме того, для объективной оценки различных OCR у нас есть собственная тестовая коллекция, содержащая графические образы 10 тыс. документов разного качества и позволяющая "промоделировать" самые различные испытания”.
“Однако Hewlett-Packard при локализации своих продуктов продолжает ориентироваться на разработки Сognitive Technologies...” - не унимался ваш покорный слуга, пытаясь вывести из равновесия всегда по-восточному невозмутимого Давида Яна. “Мы высоко ценим верность HP своему давнему партнеру, но тем не менее надеемся, что когда-нибудь и эта компания перейдет на использование наших программ”, - дипломатично ответил основатель ABBYY и от дальнейших комментариев воздержался.
Однако затем добавил: “Распознавание текста - дело очень тонкое. При выборе OCR для комплектации своего оборудования разные компании руководствуются различными критериями. Так, например, когда HP делала свой выбор, наши программы лучше понимали плохо отпечатанные тексты, а программы наших конкурентов быстрее и с меньшим числом ошибок распознавали тексты с высоким качеством печати. HP же всегда тяготела ко всему самому лучшему, не допуская возможности, что у солидных клиентов могут быть документы низкого качества печати. Возможно, это и предрешило ее выбор, который нам с учетом их точки зрения представляется весьма разумным...”
На вопрос о степени цивилизованности отечественного рынка Давид Ян ответил так: “По нашим оценкам, 96% российских пользователей FineReader 3.0 и ниже используют нелегальные копии наших программ. Но мы практически не боремся с пиратством, так как считаем, что в нашей стране основная причина воровства ПО - бедность большинства людей и организаций. Точное число законопослушных клиентов назвать довольно трудно, поскольку регистрационные карточки заполняют и отсылают нам лишь около 12% легальных пользователей. Косвенные данные свидетельствуют о том, что в прошлом году наши продукты официально использовали 100 тыс. компаний в 15 странах мира (90% этих фирм приходится на Россию). Но мы надеемся, что в связи с выходом на мировой рынок число легальных копий FineReader будет быстро возрастать. По нашим подсчетам, только в России ежемесячно продается около 4 тыс. сканеров, оснащенных Light-версиями наших продуктов. Если исключить HP (по некоторым оценкам, контролирующую около 86% отечественного рынка сканеров. - В. М.), то окажется, что под наши знамена встали практически все остальные действующие на нашем рынке производители систем бесклавиатурного ввода”.
Телефон компании ABBYY Software House: (095) 263-6658, адрес: www.abbyy.ru.
Июнь 1997 г. Американская компания NewSoft (www.newsoftinc.com) лицензировала FineReader 3.0 и стала эксклюзивным представителем ABBYY в США. Система FineReader 3.0 начала продаваться в США и Канаде под торговой маркой Presto! OCR Pro 3.0.
Январь 1998 г. Согласно оценке американского PC Magazine, система Presto! OCR Pro 3.0 входит в тройку лучших систем распознавания символов и занимает второе место по качеству распознавания (98,7%), уступая TextBridge Pro 98 (98,8%) и опережая TypeReader Professional 4.0 (98,1%), OmniPage Pro 8.0 (97,6%), Recognita Plus 3.2 (97,2%), CuneiForm OCR 3.0 (96,8%) и OCR Master (90,3%).