Новый фреймворк машинного обучения Neuton, как заявляют его разработчики, выгодно отличается от конкурентов. Насколько это соответствует действительности, на портале ZDNet разбирался аналитик Джордж Анадиотис.
Искусственный интеллект (ИИ) и машинное обучение — это очень мощные технологии, потенциал которых еще только предстоит изучить, поэтому неудивительно, что они вызывают повышенный интерес в первую очередь со стороны крупных технологических компаний типа Google, Amazon, Samsung или Facebook, обладающих достаточными ресурсами для разработки дорогостоящих решений. К слову, Facebook неделю назад выпустила фреймворк PyTorch 1.0, который предназначен для ускорения разработки приложений глубокого обучения.
Помимо технологических гигантов разработкой ИИ-платформ заняты и менее крупные вендоры — fast.ai, Databricks, которая недавно выпустила метафреймворк Mlflow, и ряд других. На этом фоне выделяется Bell Integrator, выпустившая фреймворк Neuton для обучения нейронных сетей. Этот фреймворк является полностью автоматизированным решением, не требующим от пользователя углубленных знаний или опыта в области ИИ.
Как заявил технический директор Bell Integrator Блэр Ньюман, за разработкой Neuton стоит команда ученых, которая «изучила накопленный за 700 лет человечеством опыт в области нейрофизиологии и нейроморфологические дисциплины, что позволило решить сложные алгоритмические проблемы в дополненной реальности, искусственном интеллекте, нейронных сетях, компьютерном обучении, видеоаналитике, Интернете вещей и блокчейне».
Укрываясь за подобными формулировками, компания не спешит раскрывать подробности Neuton. «Благодаря нашему запатентованному алгоритму и технологии машинного обучения, построенные на Neuton модели очень компактны — это значит, что они содержат относительно немного нейронов и коэффициентов. Но этот алгоритм — наша частная собственность, следовательно, мы не можем его раскрыть», — сказал Ньюман. Примечательно, что конкуренты Bell Integrator даже не догадывались о том, что в ее недрах ведется подобная разработка. Об этом, в частности, заявил руководитель команды разработчиков PyTorch Сумит Чинтала.
Neuton — это самообучающееся решение, для работы с ним не требуются взаимодействие на уровне слоев и нейронов. Все, что ему нужно для обучения модели — набор данных.
Глубокое обучение может быть дорогостоящим и требует огромных массивов данных. Это объясняется тем, что существует огромное количество параметров, которые необходимо настроить для алгоритмов обучения, чтобы избежать ложных срабатываний. Например, алгоритму глубокого обучения может быть дано указание «узнать», как выглядит кошка. Для того, чтобы научиться различать мельчайшие детали, которые позволяют отличить кошку от, скажем, гепарда, потребуется огромное количество изображений, причем фреймворк придется многократно переучивать, чтобы он зафиксировал отличия. В качестве преимущества Neuton называется отсутствие необходимости многократного переобучения моделей.
Помимо того, что Neuton эффективно закрепляет полученные сведения, он также при проверке полученных знаний допускает гораздо меньше абсолютных и относительных ошибок. Учитывая, что это автоматизированное решение для машинного обучения, на выходе клиент получает самообучающуюся и развивающуюся модель для внедрения ее в другой продукт, локальной работы или через облако. На сайте разработчика упоминается, что первый выпуск Neuton будет без CNN/RNN (сверточные/рекуррентные нейронные сети).
Ньюмен сказал, что Neuton — нейронная сеть, которая эффективно решает проблемы регрессии (возвращение в прежнее состояние) и классификации объектов, но для этого ее нужно обучать. Для этого от пользователя требуется несколько шагов:
- подготовить и загрузить данные;
- определить, какая часть набора данных предназначена для обучения модели, а какая — для валидации;
- выбрать метрику, в соответствии с которой будут выполняться задания, а также критерии для приостановки обучения;
- выбрать способ дальнейшего использования модели.
Neuton работает с моделями в формате hdf5. Это открытый формат, который поддерживается большинством современных языков программирования (Python, Java, R и т. д.) и фреймворков, включая Keras. Neuton может задействовать службы REST API, в т. ч. для графических процессоров. Полученные модели являются суперкомпактными, то есть они состоят из относительно небольшого количества нейронов и коэффициентов. Несмотря на это, результаты обучения моделей при помощи Neuton столь же эффективны, как и в случае с Caffe2, Tensor Flow + Keras, CNTK, Torch, Theano. Чтобы убедиться в этом, обученные модели вместе с наборами данных и используемой конфигурацией TensorFlow можно загрузить с сайта компании и опробовать их в автономном режиме.
Ньюман разъяснил отличия Neuton от PyTorch и fast.ai: «Овладение Neuton требует базовых знаний программирования, тогда как для работы с PyTorch и Fast.ai нужно знать обустройство нейронных сетевых архитектур. Это означает, что наша целевая аудитория намного шире и, независимо от уровня знаний, настроить наши модели гораздо проще. Мы также предлагаем нашим пользователям все необходимые элементы инфраструктуры, включая хранение пользовательских данных и моделей, виртуальные машины для работы с графическим процессором, виртуальные машины для развертывания в облаке, то есть все то, что необходимо корпоративным клиентам».
Он добавил, что Neuton выводит взаимодействие с ИИ на новый уровень, открывая к нему доступ для всех желающих, что «в итоге приведет к тому, что ИИ дополнит человеческую изобретательность, оказывая преобразующее воздействие на экономику, промышленность и многие другие отрасли, будет способствовать научным достижениям, улучшит качество жизни этого и будущих поколений».
Пока что Bell Integrator не озвучила стоимость Neuton и не пояснила, на каких условиях (имеется в виду лицензионное соглашение) его можно применять. Также интересно, почему разработчик не раскрывает код Neuton, тогда как большинство других ИИ-фреймворков имеют открытый код. Однако если фреймворк имеет открытый код, это еще не значит, что он бесплатный, ведь для работы с ним потребуются услуги облачных вычислений и хранения.
Возникают и другие вопросы: насколько Neuton прост в управлении? Каков будет уровень его поддержки? На бумаге поддержка API и языков программирования выглядит впечатляюще, однако неплохо будет дождаться отзывов первых клиентов, особенно в части утверждения Bell, что для работы с Newton «не требуется особых навыков». Далее, нужно учесть, что Bell Integrator — это в первую очередь консалтинговая компания, поэтому сложно спрогнозировать уровень ее готовности в случае массового обращения клиентов. Вдобавок к этому нужно заметить, что некоторые из режимов работы Neuton на данный момент не работают, однако очевидно, что если клиентам для обучения моделей нужна скорость, то Newton как никакой другой фреймворк подходит для этой роли.