Ваша походка, особенности отражения радиоволн вашим телом и его термальная сигнатура позволяют искусственному интеллекту (ИИ) идентифицировать вас без помощи телекамер, пишет на портале InformationWeek Джеймс Кобиелус из компании Wikibon.
Компьютерное зрение — кошмар защитников тайны личной жизни. Наиболее ярко это проявляется в разгорающейся войне между сторонниками компьютерного зрения (распознавание лиц с помощью ИИ) и многими разработчиками инновационных контрмер, использующими ИИ, чтобы не допустить столь назойливого наблюдения.
Обычные камеры не могут видеть сквозь стены. Таким образом, доступное массовому пользователю компьютерное зрение бессильно там, где вы можете не допустить установки камер. Но подобно тому, как слепые используют другие органы чувств, чтобы компенсировать отсутствие зрения, применяющие ИИ платформы компьютерного зрения способны создавать все более точный визуальный образ даже без захвата изображения.
В более широком смысле компьютерное зрение становится суммой данных от сенсоров, которые могут быть представлены в виде визуальных шаблонов. Благодаря совершенствованию ИИ возрастает возможность создавать высокоточный визуальный портрет на основе отражаемых телом радиочастотных сигналов, давления на опорную поверхность, вибраций, создаваемых человеком при ходьбе, и его теплового излучения. Все это по отдельности и вместе взятое представляет уникальную сигнатуру, которую можно использовать, чтобы «увидеть» человека, даже если он успешно скрывает от любопытных глаз лицо, голос, отпечатки пальцев и геном.
Вскоре может отпасть необходимость устанавливать везде камеры, чтобы скомпоновать достаточно хорошие картины происходящего внутри и вне помещений. Ниже приводится краткий обзор появившихся в результате недавних исследований инноваций, большинство которых используют усовершенствованный ИИ.
Распознавание по отраженному сигналу Wi-Fi. Даже если вы в комнате один, дверь закрыта, а окна занавешены, вас можно идентифицировать по тому, как ваше тело отражает сигналы Wi-Fi. Исследователи из MIT разработали сканер, в котором объединены источник излучения Wi-Fi, сенсоры и алгоритмы ИИ. Он моделирует действия человека, находящегося по другую сторону непрозрачного препятствия. Подобно эхолокатору эта технология, получившая название RF-Pose, определяет схематичные двумерные фигуры людей и другие объекты на основе шаблонов отражаемых ими сигналов Wi-Fi. При корреляции и перекрестном обучении с приложениями ИИ, распознающими походку, жесты и движения, по этим схематичными фигурам можно идентифицировать человека в 83% случаев.
Распознавание походки по давлению на опорную поверхность. В Университете Манчестера на основе ИИ создана система распознавания походки SfootBD почти со 100%-ной точностью. Она с помощью пассивного сенсора анализирует распределение веса, скорость и манеру ходьбы. Сигналы о давлении на опорную поверхность соотносятся с заснятой камерой высокого разрешения манерой ходьбы. Для тренировки ИИ исследователи создали базу данных сигналов о походке более чем 120 человек, измеряя давление на пол. Данные собирали в публичных местах (контрольные пункты в аэропортах, рабочие места) и в домашних условиях. Алгоритм был проверен на контрольной группе имитаторов походки, в результате чего он смог распознавать попытки копировать чужую походку.
Распознавание активности по температуре. В этой технологии нет ничего нового. Она используется при автоматизации строительства, управлении энергетическими объектами, в системах безопасности и контроля доступа. Сенсоры фиксируют выделяемое человеком или иным объектом тепло в инфракрасном диапазоне. Это один из множества параметров, определяемых новым поколением суперсенсоров, которые улавливают также звуки, вибрации, свет и электромагнитное излучение. Google является одной из многих компаний, вложивших большие средства в ИИ, необходимый для обработки всех этих данных в их совокупности, чтобы с высокой точностью распознавать действия человека и другую активность в помещениях и вне их.
Генеративная реконструкция перспективы. Исследователи строят модели ИИ, известные как генеративные сети запросов (generative query networks), которые способны посмотреть на объект под различными углами и описать, как он будет выглядеть в иной перспективе. DeepMind, дочерняя компания Alphabet, создала ИИ, который может в автономном режиме сформировать управляемую данными визуальную картину мира и даже с высокой точностью определить, что находится там, где картина нечеткая. Исследователи протестировали свой подход на квадратном столе, виртуальной руке робота и простом лабиринте. Они используют генеративно-состязательную сеть (generative adversarial network, GAN), в которой генеративная сеть создает сцены, а дискриминативная сеть пытается оценить степень их правдоподобия. GAN эффективно строит уровни деталей сцены, включая формы объектов, их расположение и цвета, используя векторное представление.
Понятно, что такие инструменты могут повсеместно использоваться правоохранительными органами, спецслужбами и военными. Но это не обязательно плохо. Видеокамеры вторгаются в личную жизнь и часто неприменимы там, где тем не менее имеется законная общественная потребность в наблюдении:
- они могут помочь полиции определить наличие вооруженных людей в соседнем помещении и их точное местонахождение, устраняя элемент неожиданности и сводя к минимуму вероятность попасть в засаду;
- они могут сделать экономически оправданными постоянный мониторинг и обеспечение безопасности каждого помещения во всех жилищах, офисах и других зданиях без затрат на установку там видеонаблюдения;
- потенциально они могли бы помочь сиделкам вести непрерывный мониторинг амбулаторного статуса престарелых, инвалидов и людей с различными заболеваниями без видеокамер, которые воспринимаются как посягательство на частную жизнь.