В настоящее время искусственный интеллект (AI) и большие данные — это суперактуальные технологии, но эффективное их использование предполагает анализ огромных объемов данных. Между тем Apple рассматривает возможность применения этих технологий без ущерба для обеспечения строгой политики конфиденциальности своих пользователей. На своей конференции World Wide Developers в г. Сан-Франциско компания объявила о ряде новых проектов в области машинного обучения и анализа данных.
По словам представителей компании, она будут использовать технологию глубокого обучения на основе рекуррентных нейронных сетей LSTM (long short-term memory) с целью усовершенствовать функцию предиктивного набора текста Quicktype таким образом, чтобы в ходе переписки она предлагала более осмысленные варианты подсказок. Например, она сможет автоматически предоставить информацию о вашем местонахождении из приложения Maps, если в ходе вашего общения с другом возникнет соответствующий вопрос.
Компания также использует глубокое обучение и компьютерное зрение для встраивания в iPhone функции распознавания лиц, что позволит пользователям группировать фотографии разных людей по отдельным альбомам. Она применяет ту же технологию для распознавания объектов и изображений местности (для идентификации каждой фотографии может потребоваться до 11 млрд. вычислительных операций), которую затем можно использовать для поиска этих объектов. Представители Apple говорят, что также применяют искусственный интеллект для анализа библиотеки фотографий пользователя и группировки изображений по месту съемки, запечатленным на ней людям и окружающей обстановке в новой закладке «воспоминаний».
Многие другие веб-сервисы (в частности, реализованные компаниями Google и Facebook) уже предлагают такие функциональные возможности, но, как правило, взамен берут с вас согласие на сбор ваших данных с целью показать вам еще больше рекламы. Однако, как утверждает Apple, в их случае такой анализ данных будет происходить не в облачном сервисе, а непосредственно в телефоне.
«Все, что касается интенсивного глубокого обучения и анализа ваших данных методами искусственного интеллекта, мы осуществляем в рамках самого устройства ...при этом ваши личные данные находятся под вашим полным контролем», — заявил в ходе конференции Крейг Федериги, старший вице-президент Apple по разработке ПО.
Apple весьма недвусмысленно определила конфиденциальность в качестве одного из основополагающих принципов своей деятельности, ратуя за использование сквозного шифрования и оказывая ожесточенное сопротивление требованиям ФБР разблокировать один из смартфонов iPhone в рамках расследования стрельбы в г. Сан-Бернадино. Федериги отметил, что все приложения Apple, в том числе Facetime, Messages и HomeKit, по умолчанию используют сквозное шифрование, а это означает, что прочитать какие бы то ни было сообщения могут исключительно отправитель и получатель (а не сама Apple или правоохранительные органы).
И хотя приложения Siri, Maps и News отправляют данные на сервера Apple, Федериги утверждает следующее: «Когда пользователь ищет в Интернете маршрут в Maps или какую-либо информацию в Spotlight, мы не создаем никаких профилей пользователя» в отличие от многих других Интернет-компаний, которые собирают подобные данные для продажи более узконаправленной рекламы.
Официальные лица Apple также заявили на конференции, что компания будет применять принцип так называемой «дифференциальной конфиденциальности», который позволит ей анализировать данные пользователя на предмет совпадений и закономерностей, не допуская при этом идентификации конкретной личности — например, с целью выявить популярные слова, которые нужно добавить в подсказки QuickType.
Федериги сказал, что принцип дифференциальной конфиденциальности подразумевает использование таких алгоритмов, как хеширование, создание подвыборок и наложение шума, чтобы «сделать возможным краудсорсинговое обучение, но при этом обеспечить полную конфиденциальность сведений о каждом конкретном пользователе».
Начиная с iOS 10, Apple будет использовать дифференциальную конфиденциальность, чтобы «наладить процесс распознавания поведенческих шаблонов большого количества пользователей без ущерба личной конфиденциальности». Компания заявила, что данная технология поможет улучшить подсказки QuickType и подходящих эмодзи, рекомендации глубинных ссылок в поисковой системе Spotlight и всплывающие подсказки в приложении Notes.
Использование больших баз данных часто затрудняет соблюдение конфиденциальности, так как даже при условии удаления из них имен и адресов электронной почты относительно просто установить, что данные получены от конкретного человека, особенно если при этом также имеется некая внешняя информация, позволяющая провести обратное декодирование скрытых данных. Принцип действия алгоритмов дифференциальной конфиденциальности подразумевает возможность извлечения лишь общих тенденций, а не данных об отдельно взятой личности.
Бизнес-модель компании Apple в основном построена на продаже устройств и приложений, а не на продаже рекламы на базе данных о том, что именно пользователи делают с этими устройствами (этим способом Google зарабатывает на операционной системе Android), так что акцент на конфиденциальности сам по себе является конкурентным преимуществом, которому соперникам будет трудно что-либо противопоставить.
Подход, конечно, интересный, но оставляет без ответа множество вопросов. В частности, актуален такой тривиальный вопрос: не приведут ли все эти дополнительные локальные вычисления к сокращению времени жизни батареи iPhone? И побудят ли они поклонников Android переметнуться на сторону Apple? Если побудят, то мы еще увидим, как другие ИТ-компании также захотят опробовать этот новый подход.