ТЕХНОЛОГИИ

В настоящее время наблюдается растущий интерес к системам машинного зрения (СМЗ). Это в значительной мере объясняется тем, что прогресс цифровой техники привел к доступности систем машинного зрения, способных решать актуальные задачи, возникающие в различных отраслях промышленности, в области безопасности и т. д. Тем не менее, судя по печати, спрос на СМЗ сегодня не удовлетворяется. Сказывается их существенная ресурсоемкость, приводящая к тому, что использование распространенных аппаратных средств, таких, как ПК, зачастую не позволяет обеспечить требуемые потребительские свойства, например, в части точности работы, габаритов и мобильности, а проектирование специализированных аппаратных средств - дело достаточно трудоемкое и дорогостоящее.

Ниже рассматривается один из возможных подходов к созданию СМЗ. Он предложен НТЦ "Модуль" (www.module.ru) и во многом определен направлениями деятельности этого центра, к которым относятся:  проектирование интегральных схем, таких, как процессор Л1879ВМ1 (NM6403) для ЦОС, СБИС 1879BM3 для аналоговой и цифровой обработки сигналов;  изготовление аппаратуры, в том числе встраиваемых и бортовых вычислителей, модулей обработки сигналов, включая и многопроцессорные (рис. 1);  создание ПО для разрабатываемой аппаратуры и решения конкретных прикладных задач.

 

Устройства цифровой обработки сигналов: слева - устройство видеообработки ВМ1;

справа - CompactPCI-модуль цифровой обработки сигналов МЦ4.04

Следует отметить, что задача эффективного распознавания изображений ставилась (и была решена) еще при разработке Л1879ВМ1. Таким образом, наличие высокопроизводительных вычислительных средств, обеспечивающих решение конкретных прикладных задач, позволило достичь определенных успехов в такой ресурсоемкой области цифровой обработки сигналов, как машинное зрение, в том числе при создании систем, способных работать с изображениями естественных сцен в реальном масштабе времени. Последнее подразумевает, что обработка изображений проводится в темпе их поступления, например, от телевизионной камеры. Именно об этой разновидности систем машинного зрения и пойдет речь в дальнейшем.

Задача обработки изображения, как правило, сводится к обнаружению объектов на нем, а зачастую и к распознаванию их класса. Можно предложить следующую классификацию таких систем (в порядке возрастания сложности):  неподвижная камера, подвижный объект;  подвижная камера, подвижный объект;  неподвижная камера, неподвижный объект;  подвижная камера, неподвижный объект.

Рис.2. Относительная длительность этапов

обработки изображения

В двух первых случаях обнаружение возможно по факту движения, в двух последних - в зависимости от конкретной постановки (в порядке возрастания сложности):  по отличию объекта от фона по яркости;  на базе исследования текстуры;  на основании анализа формы объекта.

Для СМЗ, работающих в видимом диапазоне спектра, наиболее перспективным, очевидно, является использование анализа формы объекта.

Распознавание изображений в реальном времени сопряжено с необходимостью преодоления ряда трудностей, это, в частности:  сложный характер изображения, получаемого в естественных условиях;  неопределенность условий наблюдения, в том числе масштаба, ракурса;  низкое качество исходных изображений, например, по пространственному разрешению, контрастности.

Рис. 3. Результаты обнаружения объектов

Решение указанных проблем должно базироваться на знаниях конкретной предметной области, специфики получения изображений и использования их результатов. Не меньшую роль играет эффективность аппаратно-программной реализации обработки изображений. Практика показала, что получение положительных результатов достигается в следующих случаях:  при использовании алгоритмов адаптации и обучения для обеспечения работы в меняющихся и трудноформализуемых условиях, а также при низком качестве исходных изображений;  при выборе схемы обработки информации, обеспечивающей последовательное снижение размерности информации, и в конечном итоге при переходе от изображения к его инвариантному (условиям наблюдения) описанию для преодоления ограничений, связанных с реализацией систем реального времени на относительно небольших аппаратных средствах;  при применении специально разработанного парка универсальных аппаратных средств, позволяющих собрать вычислительную систему, в том числе и многопроцессорную, из готовых компонентов для сокращения сроков создания СМЗ;  при использовании параллельных вычислений, в том числе деления разрядной сетки процессора Л1879ВМ1 (NM6403) для получения эффективной аппаратной реализации;  при накоплении и использовании ПО, позволяющего эффективно решать задачи, возникающие на наиболее трудоемких этапах обработки изображений.

Целесообразно отдельно остановиться на вопросах сокращения сроков создания программ. Для этого надо сначала сделать некоторое терминологическое отступление.

При создании систем, работающих с изображениями, удобно использовать понятие "массовые операции". Под этим термином здесь понимаются действия, оперирующие со всеми элементами (точками) изображения и, следовательно, многократно повторяющиеся. Противоположный смысл заложен в понятие "единичные операции". Они предполагают действие с компонентами, число которых не превышает нескольких десятков. В рассматриваемом случае это, например, операции над обнаруженными объектами.

Указанная выше концепция снижения размерности обрабатываемых данных предполагает, что на первых этапах обработки используются массовые операции, а на заключительных - единичные. Отсюда следует, что к эффективности программной реализации массовых операций предъявляются гораздо более высокие требования, чем в случае с единичными операциями. Другими словами, для сокращения времени разработки программ допустимо кодирование единичных операций на языках высокого уровня, например Си. Однако при выполнении массовых операций целесообразно использовать ассемблер, а применительно к процессору Л1879ВМ1 (NM6403) его векторную часть, что, конечно, усложняет разработку.

Для иллюстрации последнего тезиса на рис. 2 показано, как распределено время процессора между операциями при обсчете отдельного кадра из входного потока. Тут кроме таких традиционных для подобных систем операций, как сегментация, сопровождение и распознавание, присутствуют также адаптация к освещенности отдельных элементов наблюдаемой сцены, межпроцессорный обмен, инвариантное к масштабу и ракурсу объекта формирование его образа, межкадровое накопление результатов обнаружения и распознавания для повышения точности этих операций. В данном случае адаптация, снижение размерности и сегментация - массовые операции, остальные можно отнести к единичным.

Таким образом, наиболее трудоемкие в плане разработки части программ целесообразно строить на базе относительно универсального ПО, реализующего массовые операции. В то время как уникальные особенности системам обработки изображений можно придавать, создавая специальные программы для единичных операций.

Предлагаемый комплексный подход к построению систем машинного зрения охватывает этапы, начинающиеся с разработки специализированных интегральных микросхем и заканчивающиеся тестированием готовых СМЗ. Этот подход предполагает, в частности:  накопление и использование тщательно оптимизированных по времени выполнения программ, реализующих массовые операции;  использование языков высокого уровня для написания программ, реализующих единичные операции;  применение многопроцессорной поддержки вычислений, в том числе с возможностью программного деления разрядной сетки процессоров;  моделирование систем обработки на базе инструментальных модулей, позволяющих собирать многопроцессорные структуры из готовых компонентов.

НТЦ "Модуль" постоянно расширяет библиотеки программ, реализующих массовые операции и номенклатуру инструментальных модулей, в том числе и на базе процессора Л1879ВМ1 (NM6403).

Иллюстрацией работоспособности предлагаемого подхода может служить одна из созданных в НТЦ "Модуль" систем машинного зрения. Эта СМЗ предназначена для обнаружения, сопровождения и распознавания класса объектов по изображению, формируемому телевизионной камерой, просматривающей земную поверхность под собой. Камера может двигаться или оставаться неподвижной. Обнаруживаемые объекты также могут быть статичными или подвижными. Обнаружение основано на анализе формы объектов и предполагает предварительное обучение системы на примерах (изображениях). Аппаратная реализация системы представляет собой устройство видеообработки BM1 на базе четырех процессоров Л1879ВМ1 (NM6403). Формат входного кадра 384ґ288 при 256 градациях серого. Темп обработки - 25 кадр./c. Представленные на рис. 3 изображения иллюстрируют возможности системы (обнаруженные объекты выделены окружностями, цвет которых говорит о классе объектов).

В заключение представляется уместным напомнить тезис о том, что не следует ожидать "открытия какого-либо универсального и всюду применимого алгоритма выделения объекта", однако в конкретных случаях могут быть успешно применены относительно простые способы (Марр Д. Зрение. Информационный подход к изучению представления и обработки зрительных образов. М.: Радио и связь, 1987).

С автором статьи, старшим научным сотрудником НТЦ "Модуль", можно связаться по e-mail: aks@module.ru.