Найти основанный на данных путь вперед, который будет прибыльным и устойчивым в условиях растущих затрат на облачные технологии, экономической неопределенности и нарастающих экологических кризисов — непростая задача. Опрошенные порталом InformationWeek эксперты дают несколько советов.
Широко доступные масштабируемые инструменты работы с данными, дешевые хранилища и продвинутая аналитика заставляют нас думать, что возможность видеть все данные и знать все вытекающие из них выводы — это путь к процветанию. Но на самом деле многие организации застряли на информационном шоссе, погрязнув в бессмысленной тяжелой работе.
«Это правда, что четкие цели ведут к более эффективному анализу, но об этом многие забывают, — говорит Тим Панагос, технический директор и соучредитель компании Microshare. — Определив с самого начала четкие бизнес-цели, аналитики могут сосредоточить свои усилия на соответствующих данных, соответствующих инструментах и подходящих методологиях, избегая тем самым ненужных обходных путей и расхода ресурсов».
К счастью, существует несколько способов сделать аналитику более эффективной. Рассмотрим некоторые из них.
1. Отсортируйте данные по уровню востребованности
Знаете ли вы, кто в вашей организации использует те или иные данные? Эта информация является ключевой для того, чтобы понять, как можно начать повышать эффективность аналитики. Начните с анализа сценариев использования и рабочих процессов аналитики.
«Ключ к эффективности здесь — понимать контекст вокруг ваших данных, а не просто полагаться на автоматизацию, которая классифицирует и оптимизирует их за вас», — говорит Ян Смит, технический директор компании Chronosphere.
Например, если 80% данных в вашем озере данных ни разу никому не потребовались, то исключение их из аналитики может быть простым решением. «Но если есть еще 15%, к которым имеет доступ только один человек или одна команда, то понимание контекста этого доступа может быть очень важным. Если 5% данных используются только одним человеком, но этот человек является директором по данным, который просматривает их каждый месяц... тогда вам стоит сохранить эти данные», — добавляет Смит.
2. Проверьте, содержат ли имеющиеся у вас данные ответ, который вы ищете
Да, у вас много данных. У всех так. Но есть ли в них ответ на вашу проблему? Если вы хотите сделать свою аналитику более эффективной, сначала убедитесь, что требуемый результат действительно возможен.
«Изучите свои данные и поищите странные закономерности, выбросы или простые ошибки. Иногда имеющиеся данные просто не позволяют ответить на поставленный вопрос», — предупреждает Майкл Бертольд, генеральный директор KNIME.
Как же обнаружить этот неутешительный факт как можно раньше?
«Начните с исследовательского анализа набора данных, — советует Кэти Саламати, старший менеджер SAS по ИИ и аналитике. — Это поможет вам понять качество данных и отличить шум от выбросов. Затем постройте модели данных, чтобы выявить взаимосвязи внутри данных. С появлением мощных технологий ИИ и машинного обучения вы теперь можете рассматривать все больше и больше данных — даже все данные, а не только выборку».
3. Протестируйте модели и конвейеры ИИ
Модели ИИ, которые вы используете для анализа, могут быть неэффективными. Не думайте, что модель работает вечно или что нет ничего лучше. Дрейф данных и другие проблемы могут сбить с толку самые лучшие алгоритмы.
«Использование автоматизированного моделирования позволяет быстро построить и протестировать множество моделей, прежде чем определить лучшую из них. А усовершенствованные инструменты моделирования позволяют пользователям постоянно настраивать и переобучать модели, чтобы они продолжали приносить аналитические инсайты», — говорит Саламати.
Рассмотрите возможность внедрения методов интеллектуального принятия решений для повышения эффективности ваших результатов с точки зрения лучшего согласования с бизнесом. И последнее, но не менее важное: проверьте свои конвейеры данных и ИИ.
«Data intelligence (DI) должна быть нулевым шагом в любом аналитическом процессе, независимо от того, является ли задача причудливой конвейеризацией данных или просто составлением электронной таблицы для собрания акционеров. DI — это слой, который предшествует ИИ и BI, чтобы гарантировать, что только релевантные, точные и достоверные данные поступают в алгоритмы и аналитику», — говорит Аарон Калб, соучредитель и директор по стратегии компании Alation. По его словам, большинство неверных корпоративных решений и большая часть потерянного впустую времени работников сферы знаний с самого начала могут быть связаны с плохими данными.
4. Знайте, когда нужно остановиться
Где-то на своем пути предприятия вдруг решают, что они должны добывать все свои данные, даже темные, и выжимать из них все до последней крупицы. Неважно, что это не всегда — или даже не часто — плодотворное занятие.
«Любой, кто когда-либо занимался анализом данных, оказывался в „кроличьей норе“ и в итоге спустя несколько часов задумывался: „Что я тут делаю?“. Хотя разветвления и ответвления могут помочь вам сформировать еще лучший набор аналитических данных, они так же часто могут отвлекать от первоначального вопроса или задачи», — говорит Кэти Руди, главный специалист по данным и аналитике консалтинговой компании ISG.
Ситуация становится еще хуже, если компании продолжают пытаться найти в данных хоть что-то ценное после того, как они не нашли в них ничего, кроме грязи.
«Анализ часто может быть бесконечным занятием и не всегда имеет четкое завершение. Люди могут зайти в тупик, из которого их могут вывести бизнес-лидеры, понимающие, что решение следует принимать с ясным видением его последствий и уместных сроков», — говорит Брет Гринштейн, партнер PwC по вопросам данных, аналитики и ИИ.
По его словам, бизнес-лидеры, ориентированные на данные, понимают разницу между изучением и принятием решения, и они четко объясняют своим командам, какой уровень уверенности и точности необходим для принятия решения. «Без этого анализ никогда не закончится», — добавляет Гринштейн.