При разработке эффективной стратегии корпоративных данных организации часто выбирают между подходом «сверху вниз» и «снизу вверх». Каждый метод имеет свои уникальные преимущества и подходит для различных сценариев, пишет на портале ВigDATAwire Азия Бану Шайк, старший специалист по моделированию данных компании LTIMindtree.
Реализация метода «сверху вниз» начинается с высокоуровневого представления о потребностях и стратегических целях бизнеса, а затем это представление последовательно разбивается на детальные структуры и компоненты данных. В методе «снизу вверх», напротив, начинают с существующих источников данных и систем, концентрируются на конкретных деталях и постепенно разрабатывают полную модель данных. Выбор подхода должен быть согласован со стратегическими целями организации, потребностями в управлении данными и существующей инфраструктурой. В некоторых ситуациях наиболее эффективным решением может стать гибридный подход, объединяющий оба стиля.
Согласно руководству DAMA International «Guide to the Data Management Body of Knowledge», архитектура корпоративных данных обычно состоит из трех основных наборов компонентов дизайна. Во-первых, модель данных предприятия (EDM) — это интегрированная, предметно-ориентированная модель данных, определяющая основные данные, производимые и потребляемые всей организацией. EDM определяет предметные области, бизнес-объекты, правила и основные атрибуты данных. Далее следует анализ цепочки создания ценности информации, который согласует модели данных с бизнес-процессами, организационными ролями, приложениями и технологическими платформами. Наконец, связанная архитектура предоставления данных включает в себя архитектуру технологий обработки данных, интеграцию данных, хранилища данных, бизнес-аналитику, корпоративные таксономии для управления контентом и архитектуру метаданных.
Лучшие практики предусматривают послойное построение EDM с концентрацией на наиболее важных для бизнеса предметных областях по принципу «сверху вниз» или «снизу вверх». Краткий обзор этих слоев EDM состоит из четырех разделов.
- Модель предметной области. Здесь определяются основные предметные области бизнеса, определяющие масштаб предприятия.
- Концептуальная модель данных. Следующий уровень определяет бизнес-объекты и их взаимосвязи, а также включает глоссарий бизнес-определений и метаданных.
- Логическая модель данных. Эта модель определяет данные, необходимые для каждого экземпляра бизнес-актива. Основные атрибуты данных, отраженные в EDM, представляют собой общие требования и стандартизированные определения для широко распространенных атрибутов данных.
- Физическая модель данных. Последний слой является физическим и представляет собой композицию артефактов хост-системы — физических объектов данных — полученных из логической модели данных в сочетании с желаемой конфигурацией системы хранения. В ней подробно описывается конфигурация хранилища с таблицами, столбцами, типами данных, ключами и ограничениями.
Подход «сверху вниз»
Метод моделирования корпоративных данных «сверху вниз» начинается с общего представления о потребностях бизнеса и деконструирует их на более конкретные элементы. Это связано с тем, что если стратегия работы с данными не будет соответствовать потребностям бизнеса, собранные данные окажутся бесполезными. При нисходящем подходе приоритет отдается пониманию более широких бизнес-процессов и стратегических целей, прежде чем сосредоточиться на детальных компонентах модели данных предприятия.
Подход «сверху вниз» учитывает цели компании, начиная с глубокого понимания организационных требований. Предлагая комплексное видение архитектуры данных, этот подход способствует улучшению интеграции между различными бизнес-подразделениями и системами в локальном или глобальном масштабе. Этот метод снижает риск упустить из виду важные бизнес-потребности в моделях данных за счет приоритизации требований высокого уровня.
К недостаткам можно отнести бóльшую сложность и трудоемкость, а также бóльшие временные затраты на всесторонний анализ и итеративные доработки. Применение индивидуального подхода на основе существующих бизнес-стратегий означает, что вы не знаете, для чего и в каком объеме создавать систему. Существует вероятность того, что общая модель окажется оторванной от практических, реальных вопросов применения, особенно если первоначальные требования неясны или не оформлены должным образом.
Когда цели и стратегии не согласованы, часто возникают проблемы; наиболее эффективными являются строгие стратегии. Лицам, принимающим решения и не имеющим глубокого представления о технических возможностях, стоит организовать команду экспертов, которые глубоко понимают потребности компании. Важнейшее значение имеет установление таких критических элементов данных, как политика, право собственности и управление. Нехватка старших профильных экспертов (SME) — одна из самых серьезных проблем в настоящее время, поэтому обучение новых сотрудников является жизненно важным.
Подход «снизу вверх»
В отличие от этого, восходящий подход начинается с тщательного изучения текущих данных и систем и предполагает постепенную разработку единой модели данных предприятия. В этом подходе особое внимание уделяется использованию существующих структур и систем данных для создания комплексной архитектуры данных, начиная со сбора и ввода доступных источников данных и построения моделей данных для конкретной области, таких как сетка данных, хранилища данных и прикладные системы.
Подход «снизу вверх» использует существующие структуры и системы данных, что может быть полезно, если организация уже имеет значительную инфраструктуру данных и знает ее требования. В связи с этим его обычно проще реализовать, что потенциально приводит к меньшим сбоям и более осуществимым решениям. Этот метод позволяет реализовать постепенное развитие и интеграцию, упрощая процесс решения проблем и внесения необходимых изменений.
Одним из недостатков является то, что подход «снизу вверх» может не полностью соответствовать всеобъемлющим бизнес-целям или стратегическим задачам, поскольку он начинает работать с уже имеющимися данными. Кроме того, существует вероятность усиления текущей изолированности данных и неэффективности, поскольку этот подход делает акцент на интеграции существующих систем без обязательного решения фундаментальных структурных проблем. Объединение различных источников данных может быть сложным и трудным делом, особенно при наличии заметных расхождений в качестве, форматах или значениях данных. Значительная проблема при использовании восходящего подхода возникает, когда лица, принимающие решения, не видят ценности конечного результата на ранних этапах процесса. Это может привести к тому, что внедрение не будет завершено из-за высоких расходов или в итоге система данных окажется в единственном экземпляре, что создаст долгосрочные проблемы.
Неправильный подход к решению конкретной бизнес-задачи часто приводит к тому, что стратегия терпит неудачу и требует перепроектирования с нуля. Если же процесс внедрения пройдет успешно, возможно, что результат не будет полностью соответствовать потребностям бизнеса и потребует перезапуска; в итоге старая система может оказаться лучше новой. Соблюдение трех «P» — people (люди), process (процесс), product (продукт) — при разработке стратегии данных является залогом успеха.
Лучшие практики
KPI для стратегии данных могут охватывать различные категории, включая показатели качества данных, которые оценивают такие аспекты, как точность, полнота, своевременность и достоверность. Эффективность может измеряться показателями доступности, задержки и пропускной способности. Ценность данных можно оценить по показателям рентабельности инвестиций (ROI), дохода или экономии затрат, а показатели согласованности включают в себя уровни удовлетворенности, принятия и вовлеченности.
Следующие советы позволят организациям иметь наибольшие шансы на успех:
- Согласование бизнес-целей. Крайне важно согласовать бизнес-цели с видением и стратегией бизнеса, сохраняя при этом реалистичные ожидания результатов.
- Исследования. Изучение применимых методов и определение приоритетности соответствующих данных и технологий позволяет сэкономить время и сократить расходы, избегая несовместимости с бизнес-целями.
- Масштабируемость. Простые стратегии, включающие планы масштабирования и применение отраслевых рамок, упрощают внедрение.
- Регулирование данных. Разработка тщательного плана регулирования данных имеет решающее значение для удовлетворения всех нормативных требований и потребностей в данных.
- Проверка. Двойная проверка каждого этапа перед продолжением работы предотвращает потерю времени и ресурсов.
- Гибкость. Гибкость и постоянная переоценка целей позволяют компаниям опережать конкурентов. Например, компания Coca-Cola собрала свои данные в единую модель с помощью оцифровки, что значительно помогло ее бизнесу во время пандемии и после нее.
Методы «сверху вниз» и «снизу вверх» имеют свои преимущества и недостатки, и некоторые руководители могут принять гибридный подход. Выбор правильного подхода зависит от уникальных обстоятельств и требований организации. Сочетание общей стратегической согласованности с конкретными, действенными инсайтами позволяет компаниям разрабатывать сильные, гибкие, практичные системы данных, которые повышают эффективность принятия решений и операционную эффективность.