Еще несколько лет назад машинное обучение (МО) можно было отнести к категории развивающихся технологий, но теперь оно все более активно применяется на предприятиях для оптимизации рабочих процессов, повышения удовлетворенности клиентов или поиска новых бизнес-идей. Эксперты в области МО и ИИ поделились с порталом InformationWeek несколькими советами, которые помогут организациям избежать некоторых распространенных ошибок и повысить результативность внедрения МО-проектов.
Не распыляйте усилия на несколько проектов
Некоторые предприятия настолько воодушевились потенциальными выгодами, которые могут приносить проекты в области МО, что забыли о рисках. Однако из этого не следует, что МО нужно связать одновременно со всеми бизнес-процессами предприятия, разумнее всего начать с одного или максимум двух вариантов применения, извлечь уроки и развить успех. «Поднявшаяся вокруг МО шумиха вынуждает неспециалистов верить, что оно может делать все что угодно и что ИИ — это универсальная технология. Не обольщайтесь, реальность такова, что ИИ, МО — это специализированные технологии, которые выполняют узкий круг задач», — сказал заместитель директора по ИИ и МО федерального подразделения Boston Consulting Group Стивен Милс. — Чтобы двигаться по этому пути, нужно переосмыслить проблемы бизнеса и выбрать цель. Было бы неплохо смоделировать, как МО повлияет на вашу бизнес-модель, провести сравнительный анализ его работы на других предприятиях вашей отрасли«.
Тем не менее, гиперактивность СМИ по поводу МО может сыграть злую шутку с предприятиями, которые из опасения остаться в невыгодном положении бросаются в омут технологии без четкого представления о том, как она работает.
«Организации думают, что большой объем данных — это повод для развертывания проектов МО, глубокого обучения или автоматизации, но не все из них понимают, как их связать с повседневными рабочими процессами, — сказал CEO и директор по ИИ консалтинговой фирмы Booz Allen Hamilton Джош Элиот. — Они стартуют с крупных проектов, обладая наборами данных, не приспособленными для работы с МО или использовать которые нецелесообразно». По его словам, у отдельных организаций часто отсутствует инфраструктура для МО-решений или их внедрение ограничивается отсутствием корпоративной культуры.
При внедрении пилотных проектов МО CEO должны учитывать устойчивость предприятия к риску и наличие специалистов, которые смогут довести их до логического завершения. «Спросите себя, достаточно ли опытные у вас сотрудники, потому что проектирование и внедрение алгоритмов — это лишь часть пути. Вторая часть уравнения — реализовать проект на стороне конечных пользователей и клиентов, которые в дальнейшем будут взаимодействовать с машиной», — сказал Элиот. По его словам, к этому вопросу нужно подходить требовательно, избрав ориентированный на клиента подход. Чтобы получить наилучший пользовательский опыт, нужно привлечь к МО-проекту специалистов по созданию API. Заключать разработку должно финальное тестирование продукта с учетом всех недостатков и пожеланий, которые внесла фокус-группа.
Целостный подход к МО
МО — это межфункциональная категория, его не стоит рассматривать как разрешение технической проблемы. Разумеется, внедрение МО-проекта требует значительной технической экспертизы, но в целом оно направлено на бизнес. Другими словами, МО может оказывать влияние на бизнес-процессы, культуру и модель работы организации. «Попытайтесь спрогнозировать свои организационные изменения, очертить круг проблем и возможные способы их устранения», — сказал Милс.
В качестве пилотной программы по внедрению МО эксперты советуют избрать проект, который может оказать положительный эффект на бизнес в краткосрочной перспективе. В итоге это привлечет к нему дополнительный интерес, организационную поддержку и постоянные инвестиции. С другой стороны, не стоит сбрасывать со счетов долгосрочные проекты, потому что некоторые из них могут иметь для бизнеса стратегическое значение. «Определите стратегию применения МО для достижения долгосрочных целей — это поможет вам со временем разобраться в деталях, скорректировать стратегии», — сказал Милс.
Как правило, в выборе проекта принимают участие несколько заинтересованных сторон — разработчики и CIO, члены высшего руководства и начальники бизнес-подразделений. На обсуждение выносятся проблемы, для решения которых наилучшим образом подходит ИИ. Это, например, могут быть сложности с оперированием данными (некоторые наборы данных могут представлять интерес для организации, но не применяются ею или применяются в недостаточной степени) или рассматриваются области бизнеса, которые являются основным источником дохода для организации и где МО также может принести выгоды.
Участники диалога должны обладать глубоким пониманием бизнес-проблем, с которыми сталкивается организация, и чего она стремится достичь. Boston Consulting Group считает, что успех проектов МО только на 10% зависит от технической составляющей, 20% она отводит на обработку данных и 70% — на управление изменениями.
Установите связь между данными и МО
Важность данных сложно переоценить, особенно они важны для таких основополагающих дисциплин, как бизнес- и прикладная аналитика. Также данные могут служить в качестве обучающих моделей для целей МО, что выдвигает повышенные требования к их качеству, вводит понятие необъективности данных. «Пришло время навести порядок с данными. В принципе, это не должно препятствовать началу инициатив в области МО, поскольку для того, чтобы привести их в порядок, может потребоваться три-четыре года. Желательно на протяжении этого времени провести категоризацию данных, потому что без этого МО не заработает и организация не захочет инвестировать в технологию сверх указанного временного горизонта», — сказал Милс.
Специалисты по данным тратят много времени на приведение их в рабочее состояние. В то же время некоторые платформенные провайдеры утверждают, что большая часть этого времени тратится впустую. «Необходимо проделать огромную работу, чтобы превратить данные в машиночитаемые, — считает Милс. — Для того, чтобы провести классификацию данных, нужно учитывать множество нюансов. Так, вам надо подумать о дисбалансе классов данных и их влиянии. Например, если я собираюсь внести в базу данных классификатор клиента, отражает ли он состояние всей моей клиентской базы? Дело в том, что если связать алгоритм с сырыми данными, то это может привести к искаженным моделям, моделям, которые не так точны, как вы на то надеялись. Работа с данными куда сложнее, чем думают люди».
Не ожидайте слишком многого от готовых МО-решений
Высокий спрос на специалистов в области аналитики данных привел к тому, что рынок наводнили предложения о продуктах и услугах, которые предназначены для широкой аудитории потенциальных клиентов, включая ученых, разработчиков и даже бизнес-пользователей, однако, как показала практика, они недостаточно универсальные для решения повседневных задач.
«Будьте осторожны с выбором поставщиков и специалистов по данным, которые говорят, что у них есть комплексное МО-решение, которое может связать ваши данные с любым клиентом. Любой специалист, который работает в этой области, знает о различиях сред, понимает, что данные каждой организация отличаются от другой, они по-разному оцениваются и поэтому приводят к разным результатам, — сказал Элиот. — Алгоритмы существующих моделей могут обеспечить решение
При выборе готового МО-решения у продавца желательно ознакомиться с деталями работы алгоритмов. Конечно, не все программы несут один и тот же уровень риска, но необходимость прозрачности — еще одна важная деталь, которую следует учитывать.
Не забывайте об инфраструктурных требованиях
МО обеспечивает скорость работы, точность и рентабельность инвестиций, но все это окажется недостижимым при наличии инфраструктурных дефектов, таких как некачественные СХД или неналаженный процесс обработки необходимого количества данных. «Для обучения некоторых видов нейронных сетей требуются огромные вычислительные мощности, поэтому не все клиенты представляют себе, какой уровень начальных зинвестиций им требуется, будь то в облаке или онпремис», — сказал Элиот.
Тем временем Милс рекомендует определиться с долгосрочными целями и архитектурой МО и решать индивидуальные задачи по мере их появления. «Если бы у меня были новые модели, которые работают с одинаковыми наборами данных, функциями ETL и базовыми инструментами, это было бы в высшей степени эффективно. Стандартизированный набор систем и интерфейсов снижает риски, а также дает вам гораздо больше возможностей для выявления проблем. Если же вы каждый раз создаете новую систему с нуля, то расширяете область, где можно оступиться. Для вас будет лучше выбрать единую базовую архитектуру, которую все видят, изучают и тестируют».
Выводы
Не нужно рассматривать МО как дань моде или внедрять его «чтобы оно было». МО — это основательное решение, которое требует тщательного подхода. Вначале следует определиться с тем, если в нем настоятельная необходимость, и если ответ положительный, то тогда можно перейти к экспериментам. Однозначно не стоит связывать с МО ключевые бизнес-процессы, лучше начать с малого, постепенно наслаивая новые задачи и одновременно выстраивая долгосрочную стратегию внедрения технологии. Нужно также понимать, что МО — это не столько техническое решение, сколько средство межфункциональных отношений на уровне технических и бизнес-подразделений, которые подразумевают обмен данными, анализ результатов, работу над ошибками и т. п. Потенциал МО сулит немалые перспективы, но раскрыться он может только при тесном взаимодействии заинтересованных сторон.