Все мы слышали поговорку «данные — это новая нефть» — ценный, богатый ресурс, который становится полезным только после переработки. Однако одно из самых поразительных и в то же время пугающих сравнений — это отправка кораблей в океан для поиска месторождений нефти: некоторые из них потерпят неудачу, а некоторые сделают большое открытие, пишет на портале Datanami Диби Малакар, вице-президент по управлению продуктами компании Alation.
Глубоководная разведка и бурение зависят от точного картирования и четкого понимания океанского дна. То же самое верно и в аналитике: успех возможен только при достоверном знании корпоративных активов данных. Это означает наличие надежного процесса каталогизации и оценки данных, который обеспечивает контекст активов, использует опыт других, создает доверие к данным и помогает знать историю данных, проходящих через различные системы. Бизнес-пользователи хотят понимать и отслеживать показатели, которые они видят в BI-отчетах вплоть до облачных хранилищ данных и, в конечном итоге, до исходных систем, из которых изначально поступают данные. Что еще более важно, для успеха аналитики требуется наличие грамотных в области данных сотрудников, которые могут применять в аналитике критическое мышление.
Однако в большинстве компаний существует предубеждение относительно аналитической грамотности сотрудников, что сводит на нет все инвестиции в программы и платформы, призванные помочь им.
Решение этой проблемы начинается с разработки стратегической инициативы по превращению в компанию, управляемую данными, и последующего создания программы повышения грамотности в области данных.
Формулировка проблемы
Согласно Джордану Морроу, автору книги «Будь грамотным в области данных» («Be Data Literate»), существует четыре основных этапа анализа данных: описательный, диагностический, предиктивный и прескриптивный.
Описательный этап — это когда компании описывают ситуации с данными в ретроспективе. Он рассказывает нам о том, что произошло, и это то, что мы видим на 99% приборных панелей, отчетов в виде списков и BI-отчетов в мире. Они сравнивают изменение во времени показателей по таким параметрам, как отдел, география, магазин, сегмент продукции и сегмент клиентов.
За описательной аналитикой следует диагностическая аналитика, отвечающая на вопрос «почему?», возникающий по отношению к полученным на первом этапе результатам. Хотя описательная аналитика носит ретроспективный характер, она обеспечивает базис для детального анализа первопричин, требующего знаний в предметной области и сфере аналитики. Часто именно это является целью программ и инструментов, обозначаемых как средства самообслуживания.
После глубокого понимания причин и следствий «почему» можно начать прогнозировать, что произойдет. Предиктивная аналитика предлагает первую возможность заглянуть вперед, чтобы повлиять на будущее. В розничной торговле продавец предлагает сопутствующие товары. В мире бизнеса — уведомления об обратном выкупе поставок на основе степени истощения запасов или перемещение деталей на склады в зависимости от погоды в регионе.
Наконец, мы можем и должны использовать все собранные аналитические знания, чтобы не просто «знать будущее». Мы должны его изменять, предлагая действия/мероприятия. Это и есть прескриптивная аналитика. Если мы знаем о высокой вероятности того, что что-то произойдет (предиктивная аналитика), мы предпринимаем меры, чтобы избежать или обеспечить это. Например, если мы прогнозируем необходимость пополнения запасов на основе конкретных событий и сезонных сроков, мы можем сделать предварительные закупки в межсезонье и предварительное размещение заказов, чтобы снизить затраты на поставки и обеспечить их бесперебойность.
Существует триединая проблема, связанная с грамотностью в области данных:
- Недостаточный доступ к достоверным данным. Большинство компаний не предоставляют прозрачного доступа к достоверным данным и продолжают работать с минимальным межфункциональным обменом активами данных. Результатом этого является кропотливый медленный и ручной процесс поиска данных, пригодных для использования по назначению, трата времени и денег на повторное проведение одного и того же анализа и преодоление несоответствий в результатах анализа.
- Отсутствие обучения грамотности работы с данными. Группа людей, достаточно грамотных в области данных, чтобы выйти за рамки простого принятия описательной аналитики, как правило является весьма ограниченной. Многие нуждаются в дополнительном обучении или в активном стимулировании применения критического мышления к описательным результатам. Для этого необходимы базовые знания, связанные с использованием масштаба, сравнений, основных расчетов, единиц измерения и временных рамок. Без этого высок риск стать организацией, которая внедряет все более совершенные инструменты самообслуживания (мышеловки) без соответствующей программы обучения грамотности работы с данными.
- Привычка полагаться на инстинкт, а не на доказательства. Руководители продолжают полагаться на опыт и чутье вместо того, чтобы внедрять предиктивный и прескриптивный анализ с эмпирическими доказательствами, которые могли бы помочь им постоянно оптимизировать свой бизнес.
Подготовка к успеху
Предварительным шагом к описательной аналитике является создание базы знаний активов данных. Мы называем ее каталогом, а также характеризуем как базу знаний, ориентированную на активы данных, которая поддерживает технические и нетехнические (бизнес) персоны.
Типы интегрированных активов в каталоге включают глоссарии терминов, глоссарии метрик, топ-пользователей важнейших активов, темы обсуждений, голосования, избранное, реестры отчетов и приборных панелей, классификаторы и домены данных, связанные политики, показатели качества, популярность, опубликованные запросы и продукты данных. Все эти активы легко доступны с помощью текстового поиска и вопросов на естественном языке через браузер, электронную таблицу или средство обмена сообщениями.
Лучшая практика, используемая ведущими компаниями, заключается в том, чтобы параллельно с подготовкой каталога создавать учебную программу по грамотности в области данных, переплетая эти два процесса. Как правило, такая учебная программа размещается в системе управления обучением (LMS). Взаимосвязь каталога и LMS позволяет создавать пути обучения и ссылки на курсы по информационной грамотности со страниц ключевых активов в каталоге для конкретных персон. Цель — предоставить обучение в момент использования данных и тогда, когда это необходимо, в отличие от отдельного (старого, неудачного стиля) и обязательного обучения грамотности в области данных, которое сотрудники проходят, чтобы поставить галочку в графе соответствия для начальника.
Выход за пределы описательной аналитики
После создания каталога и программы обучения грамотности работы с данными их следует систематически внедрять в бизнес-подразделениях. Типичный вариант включает в себя курсы для начинающих, которые обеспечивают базовый уровень грамотности для всех, а также более специализированные курсы для понимания предиктивной и прескриптивной аналитики.
Грамотность в области данных — это постоянная программа, а не разовый проект. Назначьте руководителей, которые поощряют вовлеченность и вознаграждают сотрудников за постоянное участие.
Также очень важно развивать культуру постоянного фиксирования и обмена информацией, полученной в результате использования аналитики. Это создает цикл непрерывного совершенствования и микрокультуру данных, отражающую стратегическую цель предприятия.
Предиктивная и прескриптивная аналитика требуют гораздо более высокого уровня грамотности в области данных и специальных навыков в области статистики/ИИ/MО, что может стать серьезным препятствием. Целью должно быть создание пула знающих людей для создания функциональных требований, контроля, проверки и подтверждения эффективности аналитических моделей, построенных центральной группой экспертов или внешними консультантами.
Независимо от того, кто создает наиболее сложные модели, не допускайте, чтобы они были «черными ящиками» без абсолютной прозрачности. Все модели и аналитические подходы должны быть добавлены в каталог, полностью описаны и связаны с данными, которые они потребляют и производят. Таким образом вы стимулируете открытое участие и ставите во главу угла совместное обучение и понимание.
Овладение искусством быть управляемым данными
Хорошая новость заключается в том, что большинство компаний понимают, что им необходима культура данных для эффективного использования своих данных. На самом деле, большинство компаний имеют стратегическую инициативу, направленную на то, чтобы стать более управляемыми данными. Но знать что-то и предпринимать действия для достижения этого — это разные вещи. Культура данных — это не то, что можно купить, это то, что нужно создать. Культура управляемой данными компании — это то, что начинается с самого верха.