Глубокое обучение, применяемое для классификации образов, распознавания голоса и анализа видео, превращается в новое мощное направление искусственного интеллекта, пишет портал ZDNet, сообщая о результатах двух исследований в данной области.
Глубокое обучение открывает новый уровень возможностей ИИ, но его используют только специалисты по данным. Сегодня оно, наконец, созрело для «демократизации», т. е. готово стать доступным каждому набором технологий в виде многочисленных бизнес-приложений.
Глубокое обучение пытается воспроизвести человеческую логику при анализе образцов. Оно начинает получать широкое распространение в рамках корпоративных инициатив в области ИИ. Как показал опрос 154 специалистов по ИТ и бизнесу, проведенный по заказу изданий ITPro Today, InformationWeek и Interop, большинство использующих ИИ компаний (53%) планируют применить глубокое обучение в течение ближайших 24 месяцев.
Сегодня глубокое обучение является источником быстрых инноваций в области ИИ и потрясений на всех рынках, утверждается в исследовании компании Databricks. «Модели глубокого обучения могут быть обучены выполнению сложных заданий, таких как распознавание образов или речи и определение их значений, — говорится в отчете. — Их главное преимущество в том, что эти модели хорошо масштабируются вместе с данными и их производительность повышается с ростом объема данных».
Databricks определяет глубокое обучение как «специализированную сложную форму машинного обучения, которая производит обучение от начала до конца. Алгоритм глубокого обучения получает большие объемы данных, обычно неструктурированных и разрозненных, и задание осуществить классификацию. Результирующая модель способна выполнять сложные задания, такие как распознавание объектов на изображении и перевод речи в реальном времени».
Благодаря глубокому обучению, согласно Databricks, стало возможно решение следующих задач:
- классификация образов. Имеются в виду процессы идентификации и обнаружения объектов или особенностей на цифровом изображении или видео. В розничной торговле модели глубокого обучения быстро сканируют и анализируют сделанные в магазине снимки, чтобы интуитивно определять движение складских запасов;
- распознавание голоса. Это способность получать и интерпретировать диктовку или понимать и выполнять команды. Модели способны конвертировать захваченные голосовые команды в текст и затем использовать обработку естественного языка с целью понять, что было сказано и в каком контексте. В транспортной отрасли глубокое обучение использует голосовые команды, чтобы предоставить водителям возможность делать телефонные звонки и настраивать внутренние средства управления, не отнимая рук от руля;
- выявление аномалий. Метод глубокого обучения стремится распознавать в миллионах различных транзакций аномальные явления, которые не соответствуют ожидаемому поведению системы. Такие приложения могут привести к обнаружению атак на финансовые сети, выявлению мошенничества при подаче страховых исков или приобретении кредитных карт, даже к выделению данных сенсоров, свидетельствующих о проблемах с безопасностью промышленных установок;
- механизмы выдачи рекомендаций. Анализ действий пользователей с целью выдачи рекомендации на основе их поведения;
- анализ эмоций. Применяет сложные методы глубокого обучения, такие как обработка естественного языка, анализ текста и компьютерная лингвистика, для получения четкого понимания мнения и чувств клиентов и измерения эффекта маркетинговых стратегий;
- анализ видео. Обработка и оценка огромных потоков видеоматериалов для решения ряда задач, включая выявление угроз. Может использоваться для обеспечения безопасности аэропортов, банков и спортивных мероприятий.
По данным Databricks, популярными системами глубокого обучения, позволяющими приступить к использованию данной технологии, являются TensorFlow, Caffe, MXNet, Keras и PyTorch.