Аналитика данных — мощный, но ограниченный инструмент. Не позволяйте неверным аналитическим данным приводить вас к ошибочным решениям, призывают опрошенные порталом InformationWeek эксперты.
Использование аналитических данных подобно получению совета от в целом знающего эксперта: полезно, проницательно, но подлежит дополнительному изучению и интерпретации.
По словам Кентаро Тоямы, профессора Школы информации Мичиганского университета, самым большим ограничением аналитики данных являются сами данные. «Вы можете делать выводы только на основе имеющихся данных, и самый лучший анализ этих данных будет хорош лишь настолько, насколько хороши их качество и количество», — замечает он.
Часто данные собираются и анализируются изолированно. «Это усугубляется тем, как легко теперь отделам и командам создавать новые среды для анализа данных», — говорит Нима Негахбан, соучредитель и генеральный директор разработчика аналитических баз данных реального времени Kinetica. Это может приводить к принятию решений, которые не соответствуют интересам предприятия и даже могут быть контрпродуктивными. «Во многих случаях решения необходимо принимать быстро, а у аналитиков данных может не хватить времени на тщательный анализ данных и учет всех значимых факторов, — отмечает он. — Это может приводить к поспешному или неполному анализу, что в свою очередь может приводить к неоптимальному принятию решений».
Отсутствие надежной таксономии данных — классификации данных по иерархическим группам для создания структуры — создает самую большую проблему в анализе данных и его применении, говорит Сиси Чжан, исполнительный вице-президент по науке о данных и аналитике компании Razorfish, специализирующейся на интерактивном маркетинге и технологиях.
Таксономия имеет решающее значение
С точки зрения маркетинга, таксономия данных — это то, что позволяет маркетологам правильно атрибутировать эффективность по различным типам платных и собственных каналов. «Таксономия имеет решающее значение для обеспечения правильного ввода данных для получения релевантных инсайтов относительно эффективности маркетинговой деятельности», — объясняет Чжан. Она отмечает, что часто видит непоследовательное применение таксономии, а также низкий уровень управления. «Хотя мы можем провести некоторую ретроактивную очистку таксономии, если проблемы с таксономией сохраняются, они делают практически невозможным получение значимых инсайтов в масштабах компании».
Чистые и согласованные данные — это ключ ко многим возможностям анализа данных, включая отчетность, визуализацию приборных панелей, расширенную аналитику и науку о данных, говорит Чжан. «Когда таксономия неверна, то, что могло бы быть простым упражнением в понимании производительности, превращается в ручную и трудоемкую работу по ретроактивной очистке таксономии, чтобы иметь возможность использовать данные в какой-то форме», — отмечает она.
Часто таксономию не удается полностью очистить задним числом, поскольку существуют специфические метаданные, которые должны фиксироваться при проведении маркетинговых кампаний, но которые трудно приспособить задним числом, говорит Чжан. «Это означает, что результаты аналитики ограничиваются очень базовыми сведениями, которые не очень полезны для измерения или оптимизации маркетинговых инициатив», — отмечает она.
По словам Питера Кирквуда, руководителя по стратегии консалтинговой компании Zinnov, инсайты, полученные в результате анализа данных, богаты настолько, насколько богаты данные, которые используются для подготовки модели данных. Собираемые данные являются необработанными и полны предубеждений и ошибок, что требует значительных ручных усилий для их очистки и использования для обучения моделей искусственного интеллекта и машинного обучения. «Хотя МО отлично справляется с анализом данных, реальные проблемы остаются теми же, с которыми сталкивалось уже не одно поколение — „мусор на входе, мусор на выходе“», — объясняет он.
Хорошие данные трудно найти
Хорошие данные слишком часто просто недоступны. «Например, многие данные анализируются с целью предсказать будущее, — говорит Тояма. — Но, конечно, у нас нет данных о будущем, поэтому мы можем полагаться только на прошлые данные». Хотя в некоторых случаях прошлое может служить надежным указанием на будущие тенденции, «некоторые из самых тяжких грехов анализа данных случались, когда аналитик предполагал, что будущее будет похоже на прошлое, а это было не так», — отмечает он.
Между тем, в наборах данных может отсутствовать информация о том, почему что-то произошло. «Многие наборы данных не содержат прямых измерений переменных, которые мы больше всего хотим знать, поэтому в лучшем случае нам приходится делать умозаключения, которые, в зависимости от других имеющихся данных, могут быть точными или недостоверными», — объясняет Тояма.
Разумный скептицизм
По словам Негахбана, организации, добившиеся успехов в анализе данных, преодолевают ограничения этой науки, принимая мышление роста. Они задаются вопросом: «Какие данные, которые могли бы добавить еще один фрагмент к пазлу, мы не собираем?».
Помимо прочного фундамента технических навыков, самой полезной чертой специалиста по анализу данных является разумный скептицизм, говорит Тояма. «Скептицизм заставляет специалистов по анализу данных сомневаться в качестве данных, — отмечает он. — Здравый смысл говорит им, что данные редко бывают настолько хорошими, насколько они должны быть».
Однако, по его словам, слишком многие специалисты по анализу данных недостаточно скептичны. Они начинают гордиться своим анализом и привязываются к нему. «Но как только вы привязываетесь, вы перестаете быть объективным», — напоминает Тояма.