Кроме того, она сможет работать не только с графическими процессорами Nvidia (как большинство общедоступных библиотек такого рода), но и с графическими процессорами AMD. Об этом на июньского заседания Комитета АПКИТ по мониторингу развития ИТ-индустрии рассказал Станислав Ашманов, генеральный директор и основатель компании «Нейросети Ашманова», создателя PuzzleLib.
По его словам, данная российская библиотека будет доступна Open Source-cообществу, где станет конкурировать за внимание разработчиков с такими широко известными зарубежными фреймворками, как Torch (создается Facebook c 2002 г. на языках Lua и C++); Сaffe (cуществует с 2010 г., написана на языках Python и C++); Chainer (cуществует с 2014 г., написана на языках Python и C++); TensorFlow (создается Google c 2015 г. на языках Lua, Python, C++ и Java); Keras (надстройка над другими фреймворками, написанная на Python и ведущая свою историю с 2016 г.); PyTorch (создается Facebook c 2017 г. на языках Python и C++) и рядом других, включая Caffe2 (Facebook), CNTK (Microsoft), Neon (Intel & Nervana), MXNet (Apache), Deeplearning4 (Skymind).
PuzzleLib позволяет собрать нейронную сеть под конкретную задачу, визуализировать её архитектуру, запустить обучение этой нейронной сети и выгрузить обученную сеть для использования. При этом обучение сети (а это очень ресурсоемкий процесс) может происходить на компьютерах, оснащенных графическими процессорами, а обученная сеть может работать на компьютерах и даже смартфонах, оснащенных лишь центральными процессорами.
Библиотека написана на языках Python, CUDA, OpenCL и D. В настоящее время она включает свыше 60 модулей (базовых, вспомогательных, специальных и оптимизирующих), позволяющих строить нейросети, имеющие различные архитектуры (классические, рекуррентные, сверточные и т. д.) и использующие различные алгоритмы оптимизации параметров, характеризующих межнейронные связи. Кроме того, имеются готовые к использованию нейросети:
- Classic CNN, LeNet, NiN, VGG, Inception, ResNet, Darknet — в основном для классификации изображений и видео;
- SegNet и U-Net — для сегментации изображений;
- Classic RNN, LSTM, BiRNN, Yoon Kim CNN, Char DCNN (LeCun) — для анализа текстов и временных рядов.
По словам Станислава Ашманова, его компания (в настоящее время она насчитывает 13 штатных сотрудников) уже реализовала несколько коммерческих проектов на базе PuzzleLib для различных отраслей. Все они связаны с обработкой фото- и видеоинформации.
Кроме того, данная библиотека позволяет выполнять автоматическую классификацию текстов по тематикам или тональности, а также производить оценку близости текстов и осуществлять машинный перевод.
Cпектр задач, которые можно успешно решать с помощью правильно обученных нейронных сетей, огромен. Одних только индустриальных решений наберется несколько десятков. Алексей Аникин, руководитель индустриального сектора IBM EE/A, в качестве примера привел ИИ-систему видеонаблюдения, построенную на платформе IBM Power AI с использованием нейросетевых библиотек, которая может в режиме реального времени выявлять и фиксировать различные нарушения правил техники безопасности. Напомним, что данная платформа представляет собой программно-аппаратный комплекс, использующий серверы, построенные на базе процессоров IBM Power 8 с использованием графических плат Nvidia и некоторых элементов Open Source-библиотек Сaffe, TensorFlow и PyTorch.