24 сентября российская компания Cognitive Technologies устроила встречу с журналистами с целью изменить в лучшую сторону сложившийся характер отношений с прессой. Встреча проходила в неформальной обстановке.

 

Генеральный директор компании профессор Владимир Арлазаров рассказал о новых разработках и о тематике дальнейших работ. Основные направления деятельности компании Cognitive  -  наукоемкие программные продукты.

 

Cognitive Technologies основана летом 1993 года на базе Лаборатории системного анализа РАН. Бывшие и настоящие ее сотрудники создавали шахматные программы, СУБД и многое другое. В настоящее время в лаборатории работают 90 человек, что для программистской компании достаточно много.

 

Год назад фирма объявила о выпуске электронного персонального архива Евфрат, предназначенного для использования организациями и частными лицами и позволяющего организовать бесклавиатурный ввод, хранение и поиск документов. В архиве реализованы следующие функции: ввод бумажных документов и полнотекстовая их индексация и, соответственно, возможности поиска по любому слову в документе или группе слов; средства морфологического анализа, позволяющие выполнять поиск по всем словоформам данного слова; ведение архива изображений, нечеткого поиска (* в начале слова) и др. При редактировании проиндексированного документа система переиндексирует документ по вновь введенным словам.

 

В Евфрате нет базы данных в привычном смысле, так как он не хранит сами документы, а только ссылки на них, что позволяет избежать дублирования данных. Хранение индексов в сжатом формате также позволяет экономить место на диске.

 

При разработке системы учитывалась практика документо- оборота в России.

 

Не забыты и старые разработки. Первым выпущенным продуктом была программа распознавания печатных текстов CunieForm, которая продолжает совершенствоваться. В частности, улучшено качество распознавания, а выходной документ теперь может быть получен в формате HTML, однако центр тяжести разработок перенесен на автоматизацию документооборота.

 

В рамках разработок по автоматизации документооборота и были созданы следующие программы:

 

- Cognitive FormReader  -  программа автоматической обработки факсов, приходящих по факс-модему;

 

- Cognitive FaxReader  -  программа потокового сканирования и распознавания входных форм (документов на бланках), содержащих печатные символы, стилизованные цифры, "рукопечатные" символы (написанные от руки и необязательно печатным шрифтом, но каждый из которых помещен в отдельную клеточку);

 

- Cognitive FormEditor  -  программа описания и редактирования форм документов, позволяющая прямо на экране указать на поля в документе, описать их тип и получить для потокового сканирования его шаблон.

 

Хочется отметить, что благодаря использованию технологии потокового сканирования реализован, например, ввод в Башкирии налоговых деклараций. Подобный же проект для обработки деклараций для налоговой инспекции штата Массачусетс будет введен в эксплуатацию в 1997 году, и это при том, что за него взялась корпорация Unisys.

 

Компания продолжает и научные исследования, которые возможно станут базой для создания новых продуктов, однако говорить о них время еще не пришло.

 

Александр Ливеровский

Версия для печати