Идея первого прототипа аппаратной AI-платформы с открытым кодом для автоматизации помещений, впоследствии названной Mycroft, пришла к Джошуа Монтгомери в процессе переоборудования хакерспейса с элементами бизнес-инкубатора, который тот решил устроить в Канзасе. Монтгомери хотел, чтобы здание обладало способностями наподобие тех, что показывают в классических научно-фантастических фильмах и сериалах.
«Идея была навеяна компьютерами из сериала „Звездный путь“ и персонажем Джарвиса из „Железного человека“», — рассказал Монтгомери в интервью сайту ZDNet. Он хотел создать такую платформу на основе искусственного интеллекта, которая бы, «реагируя на слова входящего в комнату человека, могла бы включать и выключать музыку, регулировать освещение, открывать и закрывать двери» и многое другое.
Проанализировав положение дел с Open-Source-системами с голосовым управлением, которые бы могли лечь в основу его платформы, Монтгомери обнаружил, что работы непочатый край. «Оказалось, в этой сфере полный вакуум. В открытом ПО не существует аналогов Siri, Alexa или Cortana», — поделился Монтгомери.
В прошлом году, после завершения разработки AI-системы и учреждения компании для перевода ее на коммерческую основу, было принято решение профинансировать ее посредством краудфандинга. Но так как, по словам Монтгомери, «проекты по разработке ПО редко получают финансирование на сайте Kickstarter», компания решила сконструировать демонстрационное устройство, прилагающееся к их программной платформе, — док-станцию на базе микрокомпьютеров Raspberry Pi 3 и Arduino.
Промышленный дизайн устройства легко узнаваем, и не без причины: его конструкция создавалась под влиянием дружелюбных роботов и прочих ключевых элементов научной фантастики.
«Мы хотели, чтобы оно подавало правдоподобные сигналы, когда к нему обращаются... Мы хотели сделать его приветливым, не похожим на уже имеющиеся стандартные системы без всякой изюминки», — говорит Монтгомери, который является генеральным директором компании Mycroft.
Помимо приятных манер, демо-устройство должно было привлечь разработчиков наличием устойчивой аппаратной платформы для создания кода. «Мы сконструировали демо-устройство, чтобы разработчики убедились, что в их распоряжении есть качественные динамики и микрофон. [Разработчикам] полезно наглядно сравнить стандартные аппаратные составляющие, чтобы затем сосредоточиться на решении программных задач, а не на поиске исправного микрофона», — объясняет Монтгомери.
Проект, который компания выставила на суд аудитории Kickstarter, возымел успех: удалось получить свыше 127 тыс. долл., а последующая кампания на Indiegogo собрала дополнительно 160 тыс. долл. Первым покупателям демо-устройства стали отправлять в начале апреля, при этом все, кто сделал свой взнос, получат свои устройства к июлю.
Система работает на основе платформы Snappy Ubuntu Core и на данный момент состоит из четырех программных модулей: интерпретатора Adapt Intent Parser, преобразующего команды пользователя на естественном языке в данные, пригодные для работы системы; движка речевого воспроизведения Mimic; библиотеки преобразования речи в текст Open Speech to Text и ядра Mycroft Core, интегрирующего все эти модули.
С помощью своего хитроумного интерфейса система может говорить с пользователем, рассказывая ему прогноз погоды и последние новости, а также принимать голосовые команды для управления другими подключенными к Интернету устройствами в доме или офисе, например, включения кофейного аппарата или загрузки конкретного плейлиста в проигрыватель.
Платформа Mycroft изначально задумывалась для того, чтобы помочь людям голосовыми командами регулировать свое отопление, управлять своим календарем или запирать двери. Но ввиду открытости ее кода, разработчики взяли инициативу в свои руки и стали добавлять к этой системе разнообразные возможности.
Один из разработчиков перед тем, как идти в гости к своему младшему двоюродному братишке, страстно увлекающемуся Покемонами, ухитрился встроить в эту систему энциклопедию Покемонов. «Она стала экспертом по части Пикачу и всего, что с ним связано», — говорит Монтгомери. Mycroft также может сыпать шутками от Чака Норриса, благодаря усилиям одного разработчика и по совместительству фаната известной звезды боевых искусств.
Все это, конечно, очень мило. Но у Mycroft гораздо более высокая цель —построить систему с сильным искусственным интеллектом (AI), способную воспроизводить человеческие возможности. Компания хочет создать искусственный интеллект, «разговаривая с которым будет трудно (если вообще возможно) определить, компьютер это или нет... Мы проектируем AI, не уступающий по возможностям человеку».
Для этого Mycroft вычленяет из всего набора свойств, присущих человеку, отдельные способности и затем обучает им AI-платформу, подобно тому, как по мере своего взросления младенец учится понимать язык, позже начинает произносить отдельные словосочетания, составлять предложения и осознавать постоянство предметов.
«Замысел состоит в том, чтобы разбить концепцию человеческого разума на конкретные способности и разработать симулирующее их ПО. Этот процесс требует гигантского объема ресурсов», — говорит Монтгомери. Частично по этой причине компания решила пойти по пути открытого кода. Она хотела основать сообщество идейных разработчиков, готовых работать над проектированием AI-способностей. В настоящее время над Mycroft работают десятки разработчиков (код Mycroft Core доступен на Github), и компания рассчитывает вскоре увеличить их число до тысячи.
Mycroft также поддерживает открытый код в надежде на то, что AI, который, вероятно, будет одной из наиболее значительных технологий будущих десятилетий, не станет закрытой привилегией привычных компаний-гигантов ИТ-отрасли.
«Человек указывает на объекты и неопределенно мычит — на этой стадии мы и застряли [в разработке пользовательского интерфейса] с
Хотя компании Facebook, Google, Apple и им подобные уже инвестируют в «слабый» AI — то есть, в системы, применяющие свои интеллектуальные способности для решения одной или нескольких конкретных задач, Mycroft принадлежит к менее многочисленной группе компаний, стремящихся разрабатывать сильный AI, обладающий способностями и интеллектом на уровне человека. Настоящий сильный искусственный интеллект пока только в перспективе, и некоторые считают, что до его реализации дело никогда не дойдет.
Монтгомери, однако, уверен, что это лишь вопрос времени и нужных технологий. AI-системы уже способны имитировать людей, если под людьми подразумеваются двухмесячные младенцы, говорит он, но им еще ой как далеко до возможности потягаться с взрослым выпускником ВУЗа.
Директор компании уверен, что для появления по-настоящему сильного AI потребуется еще как минимум лет пятнадцать, так что он рассчитывает сделать все необходимое, чтобы Mycroft «продемонстрировала близкие к человеческим способности» в ходе TED-конференций в рамках конкурса AI XPRIZE, планирующегося в 2020 г.
В процессе подготовки к цели, намеченной на 2020 г., компания занимается пошаговой оптимизацией платформы Mycroft: улучшает модуляцию голоса системы, чтобы он меньше напоминал робота, и работает над другими связанными с речью проблемами с целью очеловечить звучание системы и сделать его менее похожим на компьютерное. Также компания планирует расширить языковую поддержку системы и добавить помимо английского обработку таких языков, как испанский, арабский и языки индийской группы.
Тем не менее в настоящее время вывод на рынок второй серии устройств Mycroft не планируется. «На данный момент из аппаратного обеспечения мы планируем только демо-устройства», — заявил Монтгомери, но при этом добавил, что компания с готовностью сотрудничала бы с другими компаниями, занимающимися разработкой оборудования, в работе над устройством по типу Amazon Echo или встроенной автомобильной системой на базе Mycroft. «На автомобильные [интеллектуальные] системы самый большой спрос, по их поводу больше всего жалоб, и их меньше всего применяют, — сказал он. — Мы бы с радостью занялись этим направлением».