Инновации дают повод взглянуть по-новому на применение ИТ в самых разных отраслях и сферах жизни.

Мы видим мир не глазами, а мозгом. Несмотря на то, что органы зрения сложны, фактически они являются сенсорами. Изображение формируется в результате обработки собранных данных. Самый простой пример того, как это происходит — человек не видит своего носа, потому что мозг собирает стерео-поток из фрагментов, которые видят оба глаза.

Современные фото- и видеокамеры действуют похожим образом. Светочувствительная матрица собирает данные, а программы обрабатывают их. Ни один кадр сейчас не получается прямой «засветкой» пикселов. Фактически, все цифровые фотографии — это картины, нарисованные встроенным компьютером. Как и видео, что гораздо сложнее, потому что требуется значительно большая вычислительная мощность — а значит и объем памяти, размер аккумулятора. Если бы не множество инноваций и патентов, каждый смартфон пришлось бы снабжать целым вагоном дополнительного оборудования.

К счастью, технологии не стоят на месте. Настолько, что уже разрабатываются и внедряются прикладные решения в области компьютерного зрения. Оно гораздо сложнее самой качественной съемки, потому что включает распознавание объектов. Мы ведь не только видим, еще и понимаем, где что находится, как взаимосвязано. Как и компьютеры, которые с помощью нейросетей тоже «научились» определять, с какой стороны удобнее взять предмет, видеть приближение опасности и узнавать людей в лицо. Или кошек. Например, пекинец Ван Си собрал «умный» дом для кошек, который знает каждую из своих постоялец и не пускает чужих животных. По сути это действующий прототип системы авторизации. Системы с похожим принципом действия используют платежные системы, чтобы определять владельцев банковских счетов или автоматические регистрации на авиарейсы. Машинное зрение открывает очень много новых возможностей в самых разных сферах.

Примеры использования компьютерного зрения

Практически все сферы деятельности человека так или иначе связаны с визуальными образами, через некоторое время будет сложно назвать ситуации, в которых машинное зрение не используется. Сейчас, когда мы находимся в начале этой технической революции, можно выделить несколько направлений, по которым уже достигнуты результаты. Помимо систем безопасности и управления доступом стоит отметить такие отрасли, как:

  • транспорт;
  • сельское хозяйство;
  • производство;
  • строительство;
  • медицина;
  • образование;
  • спорт;
  • реклама;
  • торговля.

Самые известные применения на транспорте — автопилоты. Любопытно, что сажать самолеты им доверили гораздо раньше, чем вести машины на дорогах общего пользования. Так или иначе, мир движется к полной автоматизации управления транспортом. В качестве одного из частных следствий это означает качественный скачок в эффективности логистики. Ведь вся транспортная сеть может работать как один единый организм.

Компьютерное зрение на транспорте связано не только с автопилотами. У него множество разных применений — от быстрого поиска свободной парковки до мониторинга состояния дорог и оценки качества инфраструктуры. Распознавание машин в потоке уже сейчас позволяет справляться с различными нарушениями, ускорять регистрацию грузов, прохождение таможни.

Аналогичным образом обстоят дела и в других сферах применения. Например, в сельском хозяйстве системы распознавания позволяют:

  • бороться с сорняками и вредителями;
  • выявлять заболевания растений, а также лечить их;
  • управлять поливом с учетом потребности, уровня влажности, других параметров;
  • контролировать созревание урожая на уровне конкретных плодов или ягод;
  • собирать урожай (тоже точечно) и одновременно вести его точный учет.

Умные конвейерные линии, которые оснащены системами зрения, гораздо быстрее и проще перенастраиваются на выпуск другой продукции. Это позволяет удешевить процесс, а также производить небольшие кастомизированные партии товаров. То есть увеличивать рентабельность и конкурентоспособность завода.

Проверка точности следования проектной документации теперь может выполняться прямо на строительных площадках. Причем машинное зрение контролирует не только объекты, но и самих рабочих. Человек без каски или страховки не будет допущен к работе, система сама проследит за соблюдением техники безопасности.

В здравоохранении компьютерное зрение помогает вести исследования, ставить точные диагнозы. Компьютерная система может заметить появление опухоли или другие проблемы на самой ранней стадии — даже там, где опытный врач не разглядит и пропустит. Роботы-хирурги разбираются в анатомии и все чаще выполняют операции полностью самостоятельно. Это невозможно делать без зрения. Кроме того, анализ динамики восстановления и помощь в реабилитации также связаны с наблюдениями. Как и обучение врачей.

Не только врачей, все образование начинает внедрять системы с дополненной реальностью — а значит, машинное зрение плюс компьютерную графику. Идеальная технология для рекламы, и она конечно там используется. Как и в спорте — для обучения, для судейства и контроля за точным соблюдением правил, фиксирования рекордов.

Технологии машинного зрения нашли свое применение и в торговле. Самое очевидное — учет товаров и покупателей, предотвращение краж. Выполняется также оценка внимания покупателей, оптимизация витрин и выкладки на торговых полках, контроль цен и скидок, сроков годности продуктов.

Емкость мирового рынка компьютерного зрения на текущий момент оценивается почти в 16 млрд. долл., а темпы роста к 2026 году не менее, чем в 3 раза. Возможно, это даже скромные прогнозы, которые недооценивают важных игроков — таких, как Россия.

Российский рынок систем компьютерного зрения

По данным TAdviser, к 2023 году объем отечественного рынка систем компьютерного зрения достигнет 38 млрд. руб. То есть за 5 лет он вырастет в 5 раз. Хорошие темпы даже для отдельного стартапа, не говоря о целой индустрии.

Распределение по лидерам отраслевых внедрений сейчас такое:

  • 32% — решения в области видеонаблюдения и безопасности;
  • 17% — промышленные решения;
  • 14% — медицина;
  • 10% — торговля.

Примеры российских проектов в области машинного зрения говорят о разнообразии и зрелости технологий. «Яндекс» продолжает обучать свои беспилотные автомобили. В апреле 2021 года X5 Retail Group объявила о разработке «умных весов», которые сами определяют вид взвешиваемого товара. Ростелеком предоставляет сервис биометрической авторизации. Череповецкий меткомбинат использует машинное зрение для управления подземными конвейерами. По ним перемещается горячий металл в рулонах между циклами технологической обработки. Производство обеспечивает своей продукцией другие предприятия промышленной группы, поэтому простои недопустимы. Система автоматического мониторинга следит за бесперебойной работой.

Еще одно применение компьютерного зрения в «Яндексе» — мобильное приложение, которое способно распознавать объекты. Достаточно навести камеру смартфона, и можно получить справочную информацию или узнать, где купить такую вещь. Более того, если в кадре есть надписи на иностранных языках, они будут переведены на русский. Это хорошая иллюстрация того, как тесно машинное зрение интегрируется с другими технологиями.

Проект Smart Timber автоматизирует измерения и учет объемов древесины на лесопроизводстве. Нейросеть с помощью машинного зрения визуализирует данные о заготавливаемом сырье и позволяет минимизировать его потери.

О том, насколько в России развита база для разработки новых решений с использованием машинного зрения, говорит тот факт, что некоторые из них создаются очень быстро. Например, в рамках направления «Умные города, Промышленность, ТЭК» на хакатоне «Цифровой прорыв» одним из конкурсных заданий стала задача по повышению безопасности железнодорожного транспорта, предложенная НИИАС РЖД. В результате были разработаны варианты автоматического распознавания людей и предметов в дверном проеме электропоезда.

Резюме

Системы компьютерного зрения становятся важной частью новой технологической платформы, необходимой для создания прикладных решений в самых разных сферах. Это одно из многих направлений, по которому российские разработчики на равных соперничают со своими зарубежными коллегами, а зачастую их превосходят.

Значимость технологии признается на государственном уровне. Минэкономики включило проекты в сфере машинного зрения в число субсидируемых в размере грантов до 100 млн. руб. на проект. Общий бюджет финансирования инноваций, связанных с искусственным интеллектом, составляет 5,26 млрд. рублей. Это многолетняя программа, она будет действовать до 2024 года. Скорее всего, ее результаты мы увидим гораздо раньше.

Сергей Плуготаренко, эксперт российской интернет-отрасли, директор РАЭК, руководитель проектного офиса всероссийского конкурса для IT-специалистов “Цифровой прорыв” — флагманского проекта президентской платформы “Россия — страна возможностей”