На недавней конференции, которая прошла в штаб-квартире Microsoft в Редмонде (США), глава компании Сатья Наделла очертил своё видение будущего технологий искусственного интеллекта (ИИ), пишет Кейси Ньютон из The Verge. Одним из достижений в этой области он считает гарнитуру дополненной реальности HoloLens — это устройство Наделла использует для просмотра текущих событий в интерактивном календаре, проецируемом на стену его дома. Описывая работу устройства, он отзывается о нём лестными словами: «умное, продуктивное, футуристичное». Производителем именно таких продуктов он хочет видеть Microsoft под своим руководством.
Нужно заметить, что у Наделлы имеются основания для оптимизма, позволяющие надеяться, что Microsoft не останется за бортом новых технологий, которые привнесут новизну в привычное взаимодействие между людьми и приложениями. В марте компания представила новое направление работы — «общение как платформа» (conversation as a platform). Базис этой платформы зиждется «на трех китах»: люди, цифровые ассистенты и боты, где люди, конечно, первичны. Замысел Microsoft состоит в том, чтобы на смену обычным приложениям, которыми мы пользуемся для поиска информации или совершения покупок, пришли чат-боты.
Это небольшие программы, автоматически выполняющие какие-либо действия через те же интерфейсы, что и человек. Они умеют распознавать лица, эмоции и другую информацию, черпая её из видео и фото. В основе технологии лежат «когнитивные API», разработанные Microsoft. Компания утверждает, что ей потребовалось без малого два десятилетия, чтобы создать лучший «штучный мозг». Для этого использовались последние достижения в области ИИ и машинного обучения.
Благодаря раннему запуску технологии в Китае, где боты отметились умением распознавать оттенки речи и эмоции, команда инженеров программного гиганта получила временное преимущество над конкурентами. Учитывая, что Microsoft первой удалось запустить платформу на базе чат-интерфейсов, это наверняка потешило её самолюбие — компании требовался реванш, поскольку соперники в лице Apple и Google оставили её за бортом мобильного рынка.
Тем временем свои версии бот-платформ выпустили другие техногиганты. В апреле о запуске бета-версии Messenger Platform объявила Facebook. Платформа соцсети позволяет разработчикам создавать ботов, способных генерировать автоматические ответы. Основной инструмент — Send/Receive API кроме текстового общения наделит чат-ботов способностью отвечать структурированными сообщениями, включая изображения, ссылки и CTA-кнопки. Месяцем позже Google представила наделённый признаками ИИ и возможностью машинного обучения мессенджер Allo.
Стоит упомянуть и об Echo — это акустическая система Amazon, в которой «обитает» голосовой помощник Alexa. Его функциональность реализована на базе специальной облачной платформы, использующей серверы Amazon Web Services. У Alexa можно осведомиться о погоде, узнать последние новости, попросить найти музыку или задать какой-либо вопрос.
Похоже на то, пишет Кейси, что Microsoft всерьёз заинтересовалась технологиями ИИ. И даже больше — она ставит на него своё будущее. Журналист вынес эту мысль после общения с разработчиками ИИ, которые пытаются внедрить наработки в области обработки естественного языка и машинного обучения во все продукты Microsoft, где только это возможно. Но возникает вопрос: а стоит ли овчинка выделки? Иными словами, сможет ли компания воплотить ИИ-наработки в коммерческих программах? Ответа на этот вопрос пока что не знает никто. Несмотря на то что вендор отличается особым чутьём — концепт первого планшета он подготовил ещё задолго до наступления эры айпадов — ему так и не удалось воспользоваться своим преимуществом.
Но теперь Microsoft не хочет упускать инициативу из своих рук. Чего только стоит ИИ-помощница Xiaoice. Программа (она запрограммирована на беседы в стиле
Помимо этого Xiaoice стала первой в мире компьютерной программой, выступившей на телевидении в качестве ведущего-стажёра. ИИ используется для чтения прогноза погоды на китайском телеканале Dragon TV. По мнению большинства телезрителей телеканала Dragon TV, Xiaoice рассказывает новости о погоде в уникальной, эмоциональной манере и чрезвычайно приятным голосом. Система использует технологию смарт-облака и крупную базу данных для точного метеорологического анализа погоды, и вещает о любых изменениях с соответствующей интонацией.
Xiaoice считается самой совершенной и «человечной» ИИ-системой, набирая 4,32 балла из 5 за «лингвистическую естественность» (человек при подобном тестировании получает порядка 4,76 балла). «Мы не настолько самоуверенны, чтобы говорить, что Xiaoice — это киллер-бот, но хотим заметить, что она справляется с задачей на новый лад. Она просто умеет поддерживать беседу», — сказал руководитель инженерной группы поисковика Bing Деррик Коннел.
Xiaoice умеет отвечать на простые вопросы, впрочем, это умеет делать и Cortana, вот только чат-бот может придавать беседе эмоциональный окрас, при этом для поддержания разговора анализирует предыдущие сообщения. Более того, интеллектуальная помощница может даже оказать поддержку в трудную минуту, подыскивая нужные слова. По мнению Коннела, Xiaoice — ни что иное, как начало новой эры для поиска информации. «Что лучше: получить в выдаче десять ссылок или правильный ответ говорящего человеческим языком бота?» — задается вопросом инженер Microsoft.
Говоря об успехах ИИ, стоит упомянуть и о неудачах. Вспомним, какой резонанс в обществе вызвало появление бота Тау. В следующие несколько часов после дебюта девушка-робот от фразы «люди такие классные» перешла к оскорблениям целых народов. Вскоре бот узнала про Адольфа Гитлера и обвинила США в терактах 11 сентября. Она также успела поддержать геноцид и возненавидеть феминисток. Несмотря на то, что у бота были модераторы, она все равно успела опубликовать много подобных твитов. После этого сотрудники Microsoft удалили почти все ее твиты и извинились.
Несмотря на эту неудачу, Microsoft возлагает большие надежды на ИИ-движок Xiaoice. «Мы существуем во времена, когда не требуется обладать навыками лингвистики или быть экспертом в области речи. Просто используйте наши инструменты. Создайте свой бот и внедряйте его куда хотите — это может быть Slack, это может быть Facebook Messenger. Конечно, мы надеемся, что вы выберите Skype или Windows. Но это ваш выбор», — сказал Коннел. Доказательством того, что Microsoft не желает удерживать монополию на бот-технологии, является проведённая ею в июне конференция для разработчиков. (Пресса нарекла её «Botness»). На состоявшемся в Сан-Франциско двухдневном мероприятии американская компания призвала «бот-мейкеров» к сотрудничеству. По словам старшего инженера Microsoft Лили Чэн, вендор заинтересован в том, чтобы производители ботов содействовали друг другу, покуда бот-технология не перерастёт в экосистему.
Microsoft, инициируя проведение подобных Botness-семинаров, надеется оказаться в центре событий. Вендор хочет взять новый старт и наверняка не прочь появиться в каждом из наиболее популярных в мире приложений для обмена сообщениями. Но Microsoft не одинока в своём стремлении построить определяющую платформу для следующего поколения компьютеров, если, конечно, речь идёт о платформе. Практически каждая крупная ИТ-компания имеет в своём распоряжении ИИ-подразделение. Подобные проекты есть у Google, Facebook и Amazon. Вопрос только в том, чем именно они занимаются. Обычно техногиганты очень неохотно комментируют это.
«Как технология, ИИ очень быстро набирает обороты, но непонятно — кто над чем работает, какие товары производит, и, наконец, пока что нет точек опоры для их сравнения. Не проясняет ситуацию и то, что большая часть кода появляется в открытом доступе», — считает футурист венчурной компании Andreessen Horowitz Бенедикт Эванс.
Несколько проясняет ситуацию Ци Лу, контролирует разработку ПО и сервисов Microsoft. По его словам, первая модель мобильного Интернета была ущербной, поскольку доля веб-трафика с мобильных устройств никогда не превышала трафик на ПК. «Мы знаем, что веб действительно не работает на телефоне. За исключением горстки пользователей основная масса загружает приложения. Вместо того чтобы просто узнать о стоимости проезда на пароме, которым они путешествуют не чаще раза в год, жители Сиэтла загружают специальное приложение», — говорит Лу. Он считает, что такая модель взаимодействия с веб не созидательная, и предстоит найти новую платформу, которая раскроет возможности мобильных устройств и облака.
Приложения возникли в ответ на HTML-ориентированный веб, они стали компромиссом, вынуждая разработчиков укрывать сложные интерфейсы в несколько крупных кнопок. Лу говорит, что это было лучшее решение на то время, но теперь, если пользователь «что-то требует от Интернета», он может делать это более естественным для человека способом — при помощи голоса. Именно от этого нужно отталкиваться в поиске «следующей большой вещи». Топ-менеджер Microsoft уверяет, что для её появления требуются пять ключевых элементов.
Первый — «канва общения», или место пересечения разговоров и общения в виде текстовой переписки. В ответ на это у Microsoft имеются Office, Outlook, Skype и Cortana.
Второй элемент — «мозг» ИИ, способный понимать сложную модель мироустройства. К слову, Microsoft занимается обучением ИИ более двадцати лет.
Социальный граф — ещё один элемент вычислительной парадигмы будущего. Его определяют взаимоотношения людей, переплетение связей — личных и рабочих. По-видимому, Microsoft неспроста приобрела за 26,2 млрд. долл. соцсеть для профессионалов LinkedIn с её 433 млн. пользователей.
Четвёртый элемент — базис для построения ИИ. У Microsoft он присутствует в виде Windows и многочисленного семейства устройств типа Xbox.
И последнее звено головоломки — сообщество разработчиков, заинтересованных писать приложения для платформы, и, соответственно, приносить доход и ей, и себе.
Разумеется, конкуренты Microsoft, претендующие на лидерство в мире ИТ, имеют превосходство по некоторым из этих позиций: у Facebook с её семейством приложений для обмена сообщениями более ёмкий социальный граф; «мозг» Google, обучаемый сотнями миллионов устройств на Android, умнее ИИ-движка Bing. Но Лу видит повод для оптимизма в другом — для достижения успеха требуется сложить имеющиеся элементы в одно целое.
Стремление Microsoft освоить новые территории проявилось ещё два года назад, во время проведения Code Conference. Сатья Наделла, всего за три месяца до этого ставший главой Microsoft, продемонстрировал присутствующими, чем станет компания под его руководством. Во время своего выступления он попросил двух сотрудников показать новую бета-версию Skype. Участники конференции увидели, как Skype сумел в режиме реального времени перевести их диалог — с английского на немецкий и наоборот.
«Сатья не давал нам спуску с этим самым Skype Translator», — говорит корпоративный вице-президент Microsoft Research Питер Ли. По его словам, команда Microsoft Research была обеспокоена, что перед ней была поставлена задача по выводу на рынок коммерческого продукта, да ещё и в сжатые сроки. Дело в том, что раньше они не решали таких задач и к тому же опасались, что разработка Skype Translator ограничит их творческую свободу. Второй проблемой стало не устраивающее их качество перевода: Skype Translator переводил речь очень формально, выдавая формулировки, которые разговорной речи не присущи.
Ещё больше усложняло задачу употребление собеседниками слов-паразитов или заимствований из других языков, не говоря уже о пении. Все эти синтаксические сложности обещали, что сделать из Skype Translator настоящего посредника для иноязычных будет не просто. Тем не менее, Microsoft Research справилась с задачей: переводчик может переводить голосовую речь с восьми различных языков. Письменный перевод текстовых сообщений осуществляется на более чем 50 языках. Skype Translator использует технологии распознавания речи, автоматического перевода и машинного обучения. То есть чем больше сервис будет использоваться, тем корректнее он будет работать.
Помимо Skype Translator программный гигант внедряет ИИ в такие продукты, как Windows и Office. Преследуемая цель — предвидеть потребности клиентов по шаблону программы Google Now, которая после разблокировки смартфона выводит маршрут, погодные условия или результаты спортивных соревнований. Одна из тестируемых Microsoft сборок Windows демонстрирует, как Cortana, опираясь на облачные вычисления и штучный интеллект, пытается предугадать действия пользователя. К примеру, она научилась выводить в меню Пуск самые затребованные контакты, документы и приложения. Чтобы получить эту информацию, голосовому помощнику требуется доступ к контактным данным, истории веб-поиска и рекомендованным приложениям.
По мере обучения Cortana будет предлагать не только статичную информацию, но и ориентироваться на время суток — утром предлагать один набор приложений, в обед — другой. «Cortana учится анализировать голосовые запросы, контекстную информацию. Это требуется, чтобы повысить вашу продуктивность. Такие данные помогут нам лучше почувствовать вас, более продуктивно управлять вашим временем», — сказал разработчик Cortana Маркус Эш. Он привел ещё один пример пользы ИИ из личной жизни: однажды получил по Outlook электронное письмо от своего босса, но забывчивость подвела его и если бы не Cortana, он не сумел бы вовремя ответить на него.
ИИ Microsoft подобрался и к Office. В 2014 г. компания начала развёртывать свой новый сервис Office Delve, предназначенный для пользователей Office 365. Главная идея проекта: пользователям не нужно запоминать, где какая информация находится или кто её опубликовал. Вся информация отображается автоматически, исходя из выполняемой работы и людей, с которыми осуществляется взаимодействие. Delve основан на алгоритме Office Graph, созданном в Microsoft. Он определяет отношения между людьми, содержимым и выполняемой в Office 365 работой. Кроме того, инструмент анализирует контент электронной почты, в т. ч. вложения и новости из социальных сетей.
О важности ИИ для Microsoft говорит приобретение ею разработчика игры Minecraft. Платформа, получившая название Project Malmo, будет использовать Minecraft в качестве испытательного полигона для подготовки системы ИИ, а также для машинного обучения и нейронных сетей. Недавно Microsoft передала наработки проекта сообществу Open Source. А доступность Project Malmo по лицензии Open Source даст возможность разработчикам создавать собственных программных ботов, которые смогут подобно людям учиться общаться друг с другом.