Искусственный интеллект может помочь извлекать и организовывать контент. Поэтому есть смысл использовать возможности ИИ в платформах управления корпоративным контентом (ECM). Рида Чоуффани, соучредитель фирмы Biz Technology Solutions, консультант по информатике в здравоохранении, облачный эксперт и архитектор бизнес-интеллекта, рассказывает на портале TechTarget, как ИИ способен расширить возможности ECM.

Поиск контента в ECM-системе часто представляет собой монументальную задачу. Особенно если контент некорректно категоризирован или находится слишком глубоко в иерархии папок. ИИ сумеет, наконец, справиться с задачей масштабного присвоения файлам метаданных, которая является непосильной для человека.

Производители систем ECM могут использовать ИИ, чтобы облегчить работу конечных пользователей и дополнить свои платформы новыми функциями. Приведем некоторые прогнозы, как будет применяться ИИ в новых системах ECM.

Поиск документов и изображений

Конечные пользователи сталкиваются с несколькими трудностями при поиске контента в корпоративной ECM-системе. При вводе точных ключевых слов в окно поиска система может не вывести нужный контент, заставляя пользователей пробовать другие формулировки для нахождения совпадения. Если платформа ECM способна обрабатывать естественный язык, она может вывести результаты, которые будут похожи на ключевые слова пользователя, но не являются точным соответствием.

Пример использования ИИ в ECM — боты, которые выдают документы по запросу конечных пользователей, не заставляя их выходить из программы для извлечения этого контента. Инструменты организации сотрудничества, такие как Microsoft Teams и Slack, уже обладают подобной функциональностью. При этом они используют способность ИИ понимать запросы пользователей и вести с ними диалог.

Далее, при поиске изображений и видео ИИ применяется для идентификации и расстановки меток с целью извлечения контента. Такие популярные поисковые машины, как Google и Bing, предоставляют возможности визуального поиска. Пользователи просто загружают изображение, а система пытается локализовать изображения, сходные с человеком или объектом, обнаруженным на изображении. Эта функциональность опирается на обработку изображений и машинное обучение, с помощью которых производятся категоризация и извлечение контента.

Поисковые машины можно рассматривать как увеличенные версии инструментов ECM, поэтому такая функциональность стала бы важным дополнением сегодняшних платформ ECM. Наибольший выигрыш получат от этого организации, которые хранят большое количество изображений в системе ECM, такие как музеи, галереи и маркетинговые фирмы.

Категоризация и индексирование данных

В ECM-системах хранятся в основном неструктурированные данные. Их объем постоянно растет, что осложняет организацию данных и управление ими.

С помощью машинного обучения и ИИ такие производители, как OpenText, включают в свои продукты функции автоматической классификации контента и глубокого анализа неструктурированных данных.

ИИ способен также анализировать контент в неструктурированных документах и производить визуализацию данных, которая может использоваться конечными пользователями в качестве инструмента навигации. Например, можно выделить в результатах поиска наиболее часто встречающиеся слова в облако слов или переходить к различными уровням или категориям документов с помощью тематических кругов (topic wheel). Такие визуальные инструменты подойдут пользователям, стремящимся локализовать определенный контент и вынужденным для этого проходить через множество уровней.