24 сентября российская компания Cognitive Technologies устроила встречу с журналистами с целью изменить в лучшую сторону сложившийся характер отношений с прессой. Встреча проходила в неформальной обстановке.
Генеральный директор компании профессор Владимир Арлазаров рассказал о новых разработках и о тематике дальнейших работ. Основные направления деятельности компании Cognitive - наукоемкие программные продукты.
Cognitive Technologies основана летом 1993 года на базе Лаборатории системного анализа РАН. Бывшие и настоящие ее сотрудники создавали шахматные программы, СУБД и многое другое. В настоящее время в лаборатории работают 90 человек, что для программистской компании достаточно много.
Год назад фирма объявила о выпуске электронного персонального архива Евфрат, предназначенного для использования организациями и частными лицами и позволяющего организовать бесклавиатурный ввод, хранение и поиск документов. В архиве реализованы следующие функции: ввод бумажных документов и полнотекстовая их индексация и, соответственно, возможности поиска по любому слову в документе или группе слов; средства морфологического анализа, позволяющие выполнять поиск по всем словоформам данного слова; ведение архива изображений, нечеткого поиска (* в начале слова) и др. При редактировании проиндексированного документа система переиндексирует документ по вновь введенным словам.
В Евфрате нет базы данных в привычном смысле, так как он не хранит сами документы, а только ссылки на них, что позволяет избежать дублирования данных. Хранение индексов в сжатом формате также позволяет экономить место на диске.
При разработке системы учитывалась практика документо- оборота в России.
Не забыты и старые разработки. Первым выпущенным продуктом была программа распознавания печатных текстов CunieForm, которая продолжает совершенствоваться. В частности, улучшено качество распознавания, а выходной документ теперь может быть получен в формате HTML, однако центр тяжести разработок перенесен на автоматизацию документооборота.
В рамках разработок по автоматизации документооборота и были созданы следующие программы:
- Cognitive FormReader - программа автоматической обработки факсов, приходящих по факс-модему;
- Cognitive FaxReader - программа потокового сканирования и распознавания входных форм (документов на бланках), содержащих печатные символы, стилизованные цифры, "рукопечатные" символы (написанные от руки и необязательно печатным шрифтом, но каждый из которых помещен в отдельную клеточку);
- Cognitive FormEditor - программа описания и редактирования форм документов, позволяющая прямо на экране указать на поля в документе, описать их тип и получить для потокового сканирования его шаблон.
Хочется отметить, что благодаря использованию технологии потокового сканирования реализован, например, ввод в Башкирии налоговых деклараций. Подобный же проект для обработки деклараций для налоговой инспекции штата Массачусетс будет введен в эксплуатацию в 1997 году, и это при том, что за него взялась корпорация Unisys.
Компания продолжает и научные исследования, которые возможно станут базой для создания новых продуктов, однако говорить о них время еще не пришло.
Александр Ливеровский