Перед развертыванием МО в вашем бизнесе следует узнать, что такое AutoML, какую пользу приносят специалисты по исследованию данных (data scientists), а также о лучших практиках использования AutoML, пишет на портале InformationWeek Эндрю Аманн, генеральный директор NineTwoThree Venture Studio.
Аналитики данных, лидеры отрасли и бизнес-пользователи сходятся в одном: демократизация данных и аналитики сегодня крайне важна. Недавний отчет Google Cloud/Harvard Business Review «Turning Data Into Unmatched Business Value» подтвердил это: 97% опрошенных профессионалов согласились с тем, что успех бизнеса зависит от демократизации доступа к данным в организациях.
Автоматизированное машинное обучение (AutoML) является важным шагом на пути к этой цели, поскольку оно позволяет легко развернуть модель MО с минимумом технических знаний. Тем не менее, хотя это открывает множество возможностей, бизнес-лидеры постепенно начинают осознавать риски и ограничения, связанные с внедрением этой технологии без предварительного понимания того, как она работает.
Рассмотрим, что представляет (и не представляет) собой AutoML, какую пользу приносят специалисты по исследованию данных, а также лучшие практики использования AutoML для запуска бизнес-проектов.
AutoML: что это такое и чем не является
В простых технических терминах AutoML автоматизирует выбор, составление и параметризацию моделей MО. Проще говоря, AutoML предоставляет методы и процессы для ускорения исследований и составления прогнозов.
Стремительный рост спроса на проекты, основанные на ИИ, в сочетании с нехваткой экспертов в этой области означает, что сложные задачи приходится оставлять для автоматизации. Однако AutoML не является универсальным средством для управления производительностью модели и не может использоваться для анализа полученных данных.
Одним из примеров ограничений AutoML является алгоритм поиска восхождением к вершине (hill climbing), когда перед моделью ставится задача найти глобальный оптимальный результат или решение. Модель AutoML часто будет работать только до тех пор, пока не достигнет вершины первого «холма» — локального максимума. Хотя кажется, что вы нашли решение, специалист по исследованию данных знает, что вы, возможно, находитесь не на самом большом «холме», и по мере дальнейшего расширения модели она будет становиться все менее точной. Квалифицированный специалист может помочь быстро расширить модель и найти глобальный оптимальный максимум.
Широкое обучение и тестирование — это то, что гарантирует долгосрочную жизнеспособность проекта. Здесь становится понятна важность привлечения технологической экспертизы. Точнее, специалистов по исследованию данных.
Ценность, которую специалисты по исследованию данных привносят в MО
Автоматизация машинного обучения началась как проект, призванный облегчить работу специалистов по исследованию данных. Устранение скучных и повторяющихся задач позволяет проекту развиваться гораздо быстрее. Минимальный человеческий вклад также означает минимальное количество человеческих ошибок. Очевидно, что AutoML всегда было дополнением, а не заменой опыта специалиста по исследованию данных.
Существует несколько ключевых обязанностей, которые специалист по исследованию данных берет на себя в каждом проекте — начиная с формулировки постановки задачи, инструктажа алгоритма, выявления корреляций между переменными признаками и заканчивая интерпретацией конечного результата модели.
Специалисты по исследованию данных также могут использовать для создания моделей MО свой прошлый опыт. Понимание того, что лучше всего работало в прошлом, помогает им принимать эффективные и интуитивные решения. Вы редко увидите ученого в лаборатории, в одиночестве работающего над решением проблемы. Работа в команде над различными гипотезами помогает компании находить наиболее эффективные решения — чего еще не достигла автоматизация.
Способность принимать интуитивные решения и формулировать гипотезы также приводит к созданию точной MО-модели в гораздо более короткие сроки. AutoML может в конечном итоге достичь в течение многих итераций точности
Использование AutoML в качестве отправной точки
Вот шокирующая статистика: менее 15% компаний внедрили возможности ИИ в производство. Правда в том, что AutoML — это отличная отправная точка для достижения 90%-ной точности вашей MО-модели. Выход за пределы 95% — вот настоящая задача. Теоретически, увеличение точности модели даже на одну дополнительную точку данных может принести миллионы долларов дохода.
Мы видим, что все больше компаний, которые в той или иной мере внедрили AutoML, стремятся улучшить свои модели. Дополнительная ценность специалистов по исследованию данных еще более очевидна при сотрудничестве с агентством, которое работает с несколькими клиентами и отраслями. Знакомство с различными проблемами, связанными с наукой о данных, дает более широкий опыт, который можно применить к каждой конкретной задаче.
Чтобы добиться максимального эффекта от машинного обучения, необходимо сочетание специалистов по исследованию данных и автоматизации. Хотя многие компании сегодня ежедневно собирают огромное количество данных, преобразование их в действенные рекомендации — это то, на чем они застревают.
Многие компании обращаются к AutoML из-за нехватки экспертизы в области науки о данных — результат дефицита ИТ-навыков. Именно здесь AutoML может послужить хорошей отправной точкой. Однако, когда ваша компания достигла предела точности модели, которую можно получить с помощью AutoML, или когда вы хотите добиться быстрых результатов от МО, экспертные знания являются обязательным условием.