Компания Cognitive Technologies анонсировала план своих работ над OCR-системой CuneiForm в рамках проекта с открытыми кодами. На сегодняшний день трудозатраты компании на разработку и совершенствование OCR-системы CuneiForm составили порядка 470 человеко-лет. С начала марта следующего года Cognitive в качестве инвестора и координатора планирует начать работы по подготовке новой версии CuneiForm с участием широких слоев компьютерного “сообщества”. Программа работ над CuneiForm как проектом с открытыми кодами получила название “Распознавание должно быть на каждом компьютере”.
Предполагается, что одним из основных результатов этого проекта должен стать рост популярности и распространенности решений в области распознавания печатных текстов благодаря открытости кода и нулевой стоимости ПО. По данным Cognitive, число активных пользователей систем распознавания (те, кто используют OCR не реже раза в месяц) за счет использования открытого ПО к 2010 г. может возрасти в пять раз — во многом за счет активного подключения к использованию OCR офисных сотрудников, учащихся школ, студентов вузов, а также государственных структур, для которых бесплатное ПО станет хорошей альтернативой пиратским продуктам. Общее число пользователей OCR к этому периоду времени может составить порядка 25 млн. чел. (сегодня это число составляет порядка 5 млн.).
Компания Cognitive Technologies планирует развивать проект в три этапа. В рамках первого этапа обеспечена доступность OCR CuneiForm для бесплатного использования (полную версию системы можно скачать по адресу: www.cuneiform.ru/downloads/index.html; впоследствии она появится и на других ресурсах).
В рамках второго этапа будет подготовлен интернет-ресурс www.cuneiform.ru, на котором любой желающий сможет бесплатно распознать документы. Запуск этого сервиса запланирован на конец января следующего года, а к концу года он позволит распознавать до 10 тыс. страниц в день.
На третьем этапе исходные коды планируется выложить для всеобщего доступа. Это запланировано на март следующего года.
По мнению Cognitive Technologies, подключение “сообщества” к разработкам в сфере OCR под руководством ученых-консультантов и менеджеров компании должно принести значительный эффект. В частности, фирма предполагает получить комплекс идей и методов, который сможет значительно усилить данную систему и дать в ближайшее время ряд “прорывных” технологических решений.