Компания “Авикомп Сервисез” совместно со швейцарской партнерской фирмой Ontos AG объявили об открытии веб-сервиса Ontos API, позволяющего в дистанционном режиме обращаться к компонентам технологического цикла обработки и интеграции знаний из текстов на русском и английском языках.
По словам представителей “Авикомп Сервисез”, суть технологии заключается в распознавании в текстах на естественном языке объектов и их связей. Базовый набор распознаваемых типов объектов и связей определен поставщиком: это, прежде всего, имена людей, названия организаций, географические названия, популярные бренды, позитивные и негативные высказывания и еще более 30 типов объектов. Пользователи сервиса также могут создавать новые типы объектов на основе собственных словарей, тем самым описывая интересующие их предметные области.
Как заявляют в “Авикомп Сервисез”, сервис обеспечивает глобальную идентификацию извлекаемых из текстов объектов. Например, “Норильский никель”, упомянутый в различных документах, представлен в базе знаний лишь одним объектом, и все извлеченные из разных текстов семантические связи (сотрудники, инвестирование, слияния и поглощения и т. п.) ассоциированы с ним.
Создатели сервиса полагают, что он позволит внешним разработчикам разрабатывать разнообразные аналитические инструменты, например системы для ранжирования объектов внимания и автоматической их классификации, диаграммы видимости объекта в прессе, средства семантической навигации по коллекции текстов.
Через Ontos API пользователям предоставляется доступ к хранилищу, содержащему на данный момент более 500 тыс. документов на русском и английском языках. Следующий релиз Ontos API позволит пользователям создавать и разрабатывать сервисы на своих тематических хранилищах документов.