По мере того как число отраслей, интегрирующих искусственный интеллект в свою деятельность, продолжает расти, все больше организаций тщательно изучают рабочие процессы разработки ИИ-систем, включая роль моделирования и данных. При этом последние — ключевой элемент успешного внедрения ИИ, пишет на портале EnterpriseAI Дэвид Уиллингем, менеджер MathWorks по продуктам глубокого обучения.

В рамках рабочих ИИ-процессов организации обнаружили, что самую большую роль в получении точных выводов играет правильно организованная на начальном этапе работа с данными. Это связано с тем, что поступающие в модель данные определяют ее умение анализировать, обучаться и принимать решения. Если модель будет анализировать некачественные данные, то такими же будут и ее выводы. И наоборот, если модель получает самые точные и полезные данные, ее выводы принесут пользу.

Как же убедиться, что данные, поступающие в модель ИИ, являются самыми лучшими из имеющихся? Ниже приводятся три совета для повышения эффективности ИИ-систем за счет подхода, ориентированного на данные.

Что делать, когда данных недостаточно

Многие организации, внедряющие системы ИИ, часто начинают с вопроса: «Достаточно ли у меня данных для построения успешной модели?». Он часто задается при разработке приложения для предиктивного обслуживания с целью обнаружения критических сбоев. Они часто приводят к разрушительным последствиям, дорого обходятся и редко повторяются, поэтому сбор достаточного количества данных о сбоях, необходимых для точного обучения модели ИИ, предназначенной для обнаружения отказов в работе оборудования в реальном мире, может оказаться сложной задачей. Существует несколько методов моделирования для получения точных, реалистичных входных данных, которые можно задействовать для такого обучения.

Первый метод заключается в создании реалистичных синтетических данных с помощью цифрового двойника. Последний может быть создан с помощью метода модельно-ориентированного проектирования (Model-based design, MBD), когда все компоненты большой физической системы, такой как автономный автомобиль или ветряная турбина, объединяются в единую модель. Это позволяет моделировать поведение системы в нескольких сценариях.

MBD традиционно используется для проектирования и моделирования систем, не включающих ИИ. Однако при использовании модели с ИИ он решает несколько проблем, позволяя инженерам проводить тысячи симуляций, охватывающих все случаи, в которых будет работать система. Полученные данные можно использовать для обучения модели ИИ.

Кроме того, обученная модель может быть включена в исходную модель системы, что в конечном итоге позволяет проверить ее работу в различных имитационных сценариях. Например, создание имитационной модели насоса, которая может генерировать данные о исправной и неисправной работе для создания приложения для предиктивного обслуживания. Эти данные затем можно применить для обучения многоклассового классификатора для обнаружения различных комбинаций неисправностей.

Другой тип цифровых двойников — это модели ИИ, создаваемые на основе исторических входных и выходных данных. Например, производитель промышленных инструментов и оборудования использует цифрового двойника для сбора необходимых данных, чтобы построить модели предиктивного обслуживания, которые в конечном итоге будут развернуты на более чем сотнях тысяч воздушных компрессоров, эксплуатируемых на глобальных производственных предприятиях.

Синтетические данные также можно получить с помощью глубокого обучения. Если у вас нет доступа к модели системного уровня, можно использовать такие методы, как генеративные состязательные сети (generative adversarial networks, GAN). GAN доказали свою эффективность даже при относительно небольшом количестве входных данных, что позволяет использовать их для создания синтетических данных, которые похожи на реальные данные, поступающие в сети.

Что делать, если нужных данных нет

Частым разочарованием при разработке моделей ИИ является осознание того, что большее количество данных не приводит к автоматическому улучшению работы модели. Вместо того чтобы спрашивать, достаточно ли у новой системы ИИ данных для получения точных выводов, инженеры должны задаться вопросом, правильные ли эти данные. Если данные, используемые моделью для обучения, не точны, то и результаты, которые она генерирует, не будут точными. Как правило, создание модели ИИ для предиктивного обслуживания требует от инженера просеять данные сотен или тысяч датчиков анализируемой системы.

Поиск характеристик, необходимых для обучения точной модели, может занять много времени. К счастью, существуют способы частично или полностью автоматизировать процесс конструирования признаков. Последний использует функции более высокого уровня, которые позволяют обучить модель с точностью, соответствующей результатам, которые были бы достигнуты при выполнении процесса вручную. Частично автоматизированное конструирование признаков с использованием рабочих процессов на базе приложений позволяет инженерам исследовать, извлекать и ранжировать признаки из имеющихся у них данных.

Какие данные могут помочь в интерпретации модели

Модели ИИ редко преподносят неприятные сюрпризы, если они созданы на основе точных, хорошо подготовленных данных. Существует множество инструментов, помогающих убедиться в том, что они обрабатывают данные правильно, а также методов визуализации, которые помогают инженерам понять, как модель принимает те или иные решения. Приложения и инструменты, позволяющие инженерам изучать прогнозы, выдаваемые сетью классификации изображений, применяют несколько популярных методов визуализации глубокого обучения, включая чувствительность к окклюзии, Grad-CAM и атрибуцию градиента.

Инженеры также могут проверить работу модели экспериментально. Например, при создании модели можно настроить ее гиперпараметры, сравнить результаты использования различных наборов входных данных или протестировать различные архитектуры глубоких сетей. Полезными являются инструменты, которые позволяют инженерам иметь все результаты этих экспериментов в одном месте, чтобы сделать обоснованный выбор лучшей модели.

Подход, ориентированный на данные, значительно повышает шансы компании внедрить ИИ правильно. Имея правильные исходные данные, инженеры смогут построить более совершенные модели, что позволит лучше интерпретировать принципы их работы и те преимущества, которые они могут принести для решаемой бизнес-задачи.