Технический комитет UIMA консорциума по стандартизации структурированных данных OASIS представил в ноябре спецификацию Unstructured Information Management Architecture (UIMA) 1.0. Она определяет способы унифицированного представления и обработки неструктурированной информации — например, разнообразной корпоративной документации, отчетов, почты, голосовых сообщений, фотографий, видеороликов и т. д. Типичным примером неструктурированной системы служит Интернет.
Содержимое подобных наборов данных желательно уметь анализировать и быстро находить в них нужные сведения, но для этого необходимо понимать смысл их содержимого. UIMA предлагает для этого средства метаописания, независимые от конкретного типа данных, и определяет платформно-независимые принципы их представления. В обработке данных помогут возможности UIMA по построению моделей, совместимые с промышленными стандартами программирования. UIMA также определяет способы исследования, объединения и повторного использования результатов анализа и описывает сервисы для стыковки с существующими технологиями.