Концепция стратегического управления данными Data Governance (DG) уже достаточно известна на российском рынке, и цели, достигаемые бизнесом в результате ее внедрения, понятны и четко декларированы. Вместе с тем практика ее имплементации изобилует нюансами, которые в литературе, как правило, пока обсуждаются не очень системно. Мы решили опросить экспертов российского рынка и узнать, каков их взгляд на целый ряд характерных ключевых моментов.
У концепции DG много формально правильных и при этом весьма емких определений. На практике же часто бывает более целесообразно сравнить эту концепцию с теми методами и подходами менеджмента данных, с которыми отечественный пользователь уже неплохо знаком.
Подобных методов и определений за всю историю развития российского рынка набралось немало. На сей счет у наших экспертов складываются если не одинаковые, то по крайней мере схожие мнения. Еще больше единодушия в том, что DG скорее связано со стратегией менеджмента данных, нежели с процессами оперативного управления, а следовательно, здесь мы всегда говорим о концепции, идеологии и лишь потом об операциях с данными и соответственно о программной поддержке работы с ИТ-ресурсами.
«DG представляет собой стратегический подход к управлению данными, и сюда входят такие задачи, как методы наблюдения и контроля за этими процессами, разработка стратегии, формализация оргструктуры, перечисление ролей», — утверждает Юрий Бондарь, заместитель генерального директора SAP CIS.
«Data Management, Master Data Management, Data Quality Management, Information Lifecycle Management — составные части DG. По сути DG представляет собой стратегическое управление данными. Это подразумевает, что соответствующие ему подходы к менеджменту данных становятся бизнес-функциями и выходят за рамки какого-то отдельного технического инструмента, — несколько иными словами формулирует фактически ту же мысль Александр Тарасов, управляющий партнёр DIS Group. — DG нацелено на обеспечение глобального качества данных, что в свою очередь означает обеспечение ликвидности такого актива, как данные. Оно включает в себя процессы, организационные структуры, ответственность за ввод, трансформацию, изменение данных, методику формирования терминов, составление бизнес-глоссария и т. п.»
О том, что DG — это в первую очередь организационная инициатива, прямо говорит и Михаил Александров, руководитель практики платформенных решений «SAS Россия/СНГ». «Такие технологии, как Master Data Management, Data Quality Management, Data Integration, Metadata Management, позволяют обеспечить процессы и правила управления данными, определенными в рамках Data Governance, то есть они решают более частные задачи, являются элементом общей платформы для работы с данными, а инструмент DG позволяет наладить оркестровку процессов, — утверждает он. — Конечно, чтобы обеспечить качественное управление данными для тех объемов, с которыми компании сталкиваются в современном мире, использование специализированных инструментов вроде Data Quality Management или Master Data Management просто необходимо».
«DG является концепцией организации процессов», — говорит Андрей Пивоваров, руководитель группы перспективных технологий предпроектного консалтинга Oracle в России и СНГ, в явной форме перечисляя шесть компонентов, которые, по его мнению, составляют эту концепцию. Это DG Stewardship, инструменты управления качеством данных, управление мастер-данными, метаданные и глоссарий, жизненный цикл данных, а также безопасность данных. «Однако сами по себе они не обеспечивают управления данными, — считает он. — Основу DG составляет разрешение вопросов с данными в масштабах предприятия (кросс-доменное или кросс-функциональное), метрики данных и данные о прогрессе на шкале таких метрик, привлечение реальных владельцев процессов из функциональных департаментов».
«DMBOK трактует понятия Data Management и DG следующим образом: Data Management — разработка и выполнение планов, политик, программ и практик, которые обеспечивают, контролируют, защищают и повышают ценность данных и информационных ресурсов на протяжении всего их жизненного цикла; DG —руководство и контроль (стратегическое планирование, мониторинг, обеспечение выполнения) в области Data Management», — ссылается на один из основополагающих в мировой практике документов, посвященных управлению данными, ведущий архитектор компании «Юнидата» Роман Стрекаловский.
«Юнидата» — лидер российского рынка систем управления данными
Роман Стрекаловский, ведущий архитектор компании «Юнидата»:
— «Юнидата» — инновационная российская ИТ-компания, успешно работающая в области создания программного обеспечения. Ядро команды сформировалось в 2007 г. как R&D-команда различных стартап-компаний. В течение целого ряда лет специалисты «Юнидаты» реализовывали крупные проекты по внедрению решений класса MDM (Master Data Management, управление мастер-данными) и управлению качеством данных (Data Quality). Их работа получила множество положительных отзывов от известных аналитических агентств, таких как Gartner и Forrester. Среди клиентов «Юнидаты» — АО «Российские космические системы», Объединенная приборостроительная корпорация, Министерство сельского хозяйства Российской Федерации, РЖД, «МегаФон».
Нашими специалистами накоплены не только технологические знания, опыт в проектировании, разработке и контроле качества информационных систем, но и серьезная экспертиза по внедрению продукта на российском и зарубежных рынках.
Флагманским продуктом компании является многофункциональная платформа для построения систем управления корпоративными данными «Юнидата».
«Каждый производитель по-своему видит, какое решение относить к этой стратегии. Наши заказчики под этим термином часто подразумевают следующие технологии: Metadata Management, Business Glossary, Data Quality Management, Data Stewardship», — комментирует Егор Осипов, руководитель направления Big Data компании КРОК.
Если продолжать разговор о компонентах обсуждаемой нами концепции, то разница в трактовке опрошенных нами экспертов, безусловно, существует, но касается скорее нюансов. Александр Тарасов считает, что именно в последнее время в концепцию DG эксперты начинают включать и так называемый Knowledge Management — управление знаниями в компании. Егор Осипов, наоборот, исключает один из элементов, который некоторые к данной концепции как раз относят. Речь по его мнению идет о небезызвестной, но несколько подзабытой идеологии управления жизненным циклом изделия (Information Lifecycle Management).
Порог вхождения
Говоря о практическом применении концепции DG, логично было задать экспертам вопрос о том, в каких ситуациях у российских предприятий может возникнуть потребность в ней и насколько они готовы к её внедрению. Потенциально это может зависеть от структуры бизнеса предприятия, от того, насколько тесно его деятельность связана с ИТ, от зрелости информационной поддержки, накопленной на предшествующих этапах автоматизации, от квалификации персонала и, может быть, от некоторых иных факторов. В совокупности такие факторы можно было бы назвать неким «порогом вхождения» компании в отношении внедрения DG.
Никакого порога, связанного с объективными характеристиками бизнеса, в настоящее время не существует, есть только определенные нюансы с точки зрения оптимальности ее развертывания — таково единодушное мнение наших экспертов. «В современных условиях каждая компания должна выстраивать процессы DG, или она рискует быть оштрафована регулирующими органами. В Европе компания, которая имеет более 250 сотрудников и более 5000 записей о клиентах, партнерах или поставщиках, должна иметь DG», — поясняет Андрей Пивоваров.
«К задаче внедрения DG подходят более зрелые предприятия, которые уже успешно решают все свои операционные задачи, имеют построенное хранилище данных с процессами построения бизнес-отчетности и рассматривают Data Lake как следующий шаг развития. Сейчас любой бизнес связан с данными, поэтому их понимание крайне важно для каждой компании», — утверждает Андрей Орлов, технический эксперт по интеграции и управлению данными «IBM Россия/СНГ».
«Любое предприятие, даже если оно не автоматизировано, в той или иной мере управляет данными, основной вопрос состоит в степени погружения. В начале развития компании нужно просто хранить данные, потом передавать их между системами, затем встает необходимость выделения мастер-данных и так далее. Другими словами, управление данными нужно всем. Главное понять, какие механизмы нужны сейчас», — полагает Владимир Рождественский, генеральный директор компании DATAREON.
Управление данными — с чего начать?
Владимир Рождественский, генеральный директор компании DATAREON
Вопросы управления данными (Data Governance), которым раньше уделялись вторые роли среди рассматриваемых задач, способных оказать влияние на работу предприятий, в последнее время все чаще выходят на передний план. В век цифровизации и повального использования автоматизированных систем данные становятся ценным ресурсом, и легкомысленное отношение к ним не сулит ничего хорошего для устойчивой работы организаций, а тем более для их развития.
К сожалению, для решения вопросов управления данными на предприятии нужно преодолеть довольно много сложностей. Обусловлены они в основном историческим наследием в виде «зоопарка» систем и подходов к управлению, хотя отсутствие изначальной ориентации процессов управления на качество данных тоже стоит учитывать.
Взять, скажем, стандартную ситуацию, когда на предприятии существует несколько автоматизированных систем, которые внедрялись в разное время и, что очень важно, разными командами с разным мировоззрением и различными подходами к автоматизации.
«Организации нужны общие политики и автоматизированный процесс оркестровки всех процессов работы с данными, понимание, где, как, какие данные и когда используются, как обеспечивается и поддерживается их актуальность и т. д. Порогом является понимание ценности данных как корпоративного актива, источника преимуществ, экономии и дополнительной выручки. И сегодня внедрение DG уже является обязательным для любой компании», — говорит Михаил Александров.
Юрий Бондарь считает, что совсем не обязательно тратить большие средства на внедрение различных технологий и небольшим предприятиям достаточно использовать то, что у них уже есть. «Но при этом для компаний любого размера и из любой отрасли важно понимать, что управление данными является задачей бизнеса, решение которой неотделимо от ответственности всех сотрудников, а не только тех, кто работает в ИТ-службе. Это должно стать частью корпоративной культуры и бизнес-стратегии компании», — пояснил он.
«Каждая компания самостоятельно принимает решение о готовности к внедрению DG. Для многих российских предприятий работа с данными становится одной из самых приоритетных задач, а значит, они достигли нужного уровня зрелости», — отметил Егор Осипов.
«DG нужно всем компаниям вне зависимости от их размера, отрасли, организационной структуры и квалификации персонала. Несомненно, уровень зрелости DG в разных компаниях разный. Но он может различаться и в компаниях одной и той же индустрии и одинакового размера. Стоит также отметить, что какие-то организации занимаются стратегическим управлением данных осознанно, какие-то интуитивно. Между зрелостью ИТ-отделов и зрелостью DG корреляция очень слабая. Сильные инициативы и проекты по управлению данными могут быть и у небольших молодых ИТ-команд», — высказал сволё мнение Александр Тарасов.
Практический интерес и реальные возможности
Еще один практический вопрос состоит в том, как может быть связано внедрение DG с теми целями, которые обычно стоят перед российскими предприятиями безотносительно использования данной концепции. Речь, например, может идти о том, как эффективно приспосабливаться к изменениям законодательства и различных регулирующих актов. Вполне уместно сказать, что DG может способствовать реализации политики слияний и поглощений, открытию новых и трансформации имеющихся направлений в бизнесе, а также выходу на зарубежные рынки. Все это масштабные задачи, которые связаны не только, да и не столько с ИТ, не говоря уже о конкретных ИТ-направлениях. Но в то же время некоторые бизнес-цели из приведенного списка вполне явно ассоциированы с небезызвестной цифровой трансформацией, а значит, с новыми стратегическими направлениями бизнеса.
«Не так давно Informatica опросила директоров по данным (CDO) крупнейших европейских компаний. Более 60% респондентов рассказали, что их основную функцию руководство видит в поиске новых моделей ведения бизнеса и новых цифровых возможностей его развития. Что это, если не стратегия, частью которой обязательно должно быть DG?» — вопрошает Александр Тарасов.
«Обычно первоначальная идея внедрения DG связана с необходимостью соответствовать требованиям регулятора. В качестве побочного эффекта эта концепция ведет к большей уверенности при использовании данных всеми категориями сотрудников компании — от генерального директора до линейных служащих. Со временем все это становится привычкой ежедневного, ежечасного и даже поминутного анализа и использования данных, поддерживающих повседневные операции, для генерального директора, топ-менеджмента, менеджеров среднего звена и отдельных специалистов. Это способствует лучшим решениям, инновациям на всех упомянутых уровнях, увеличению дохода и сокращению затрат. Кроме того, данные все шире интегрируются между бизнес-структурами и цепочками поставок», — комментирует Андрей Пивоваров, делая некоторый акцент на задачах из категории compliance, а также на междисциплинарной проблематике бизнеса, включая кросс-функциональные задачи, охватывающие в том числе и внешние цепочки поставок.
Михаил Александров говорит о приоритетном обеспечении качества данных и методах машинного обучения в работе с ними и лишь затем переходит к бизнес-задачам. «В целом DG помогает навести порядок в данных, процессах и системах, обеспечивая прозрачность, понимание сильных и слабых сторон и новых возможностей роста. На уровне бизнес-решений это позволяет повысить результативность основных процессов. Если, скажем, речь идет о банке, то в отчетности для регулятора будет намного меньше ошибок, а те, которые возникнут, вы сможете быстрее и проще устранить. Если же вы онлайн-магазин, то вы можете быстро перестроить процессы сбора и использования клиентских данных для соблюдения новых требований к их защите», — считает он.
Юрий Бондарь делает акцент на том, что в целом ряде изменений, являющихся необходимыми в случае проведения серьезных преобразований бизнеса, подходы к управлению данными должны быть, во-первых, не забыты, а во-вторых, методически грамотно вписаны в другие процессы трансформации. «Если компания ставит себе новую цель, скажем, выйти на зарубежный рынок, то она составляет бизнес-план, в котором прописывает все шаги и сроки. И в этот момент важно понять, на основе какой информации будут приниматься решения, откуда эти данные возьмутся, нужного ли они качества, быстро ли их можно получить, не противоречат ли они другим данным и т. д., — объясняет он очень важные нюансы. — И тогда DG будет способствовать достижению поставленной цели, а не превратится в бюрократическую процедуру».
Компетенции традиционные и уникальные
Очень важной и разноплановой проблемой является вопрос кадрового обеспечения внедрения и последующего использования методов работы с информацией, которые предполагает DG. Важно, что в данном случае могут быть задействованы специалисты многих категорий, не говоря уже о конкретных позициях. Сейчас много говорят о таких специальностях, как Data Scientist, Data Engineer, Data Architect, Chief Data или Digital Officer. Не все из них напрямую связаны с DG, но все так или иначе касаются вопросов управления данными. С внедрением DG связаны многие должности и роли (как из сферы ИТ, так и из бизнеса), которые традиционно существовали на предприятии или должны быть введены в штатное расписание компании уже сегодня.
С позиций общей классификации задач DG подходит к проблеме Юрий Бондарь: «В модели управления данными можно выделить несколько уровней — стратегический, средний, оперативный. Стратегический — это уровень CDO, где определяется общая концепция управления данными и принимается решение о том, как будут организованы следующие два. Также это уровень для принятия окончательных решений по спорным вопросам в случае эскалаций. Само же управление данными происходит на нижнем уровне и подразумевает появление в компании новой роли — Data Steward, управляющего данными, или диспетчера данных».
Андрей Орлов делает акцент на важности сочетания традиционных компетенций корпоративного ландшафта с новыми ролями, которых требует обсуждаемая нами концепция. «Если посмотреть внимательно, то DG опирается на три сущности: люди, процессы и технологии. Поэтому для внедрения концепции необходимо провести изменения внутри компании. В основном это связано с появлением новых ролей, новых зон ответственности и непосредственно бизнес-процессов. Конечно, администраторы ИТ-систем и баз данных, контент-менеджеры и другие роли никуда не исчезают: они полностью вовлекаются в процесс DG. Но с переходом к концепции DG 2.0 к ним присоединяются и бизнес-пользователи, и аналитики, и Data Scientist’ы, и многие другие», — утверждает он.
«В идеальном случае, конечно, выделение специфических ролей повышает качество работы с данными, но в реальности все наталкивается на отсутствие готовых специалистов на рынке, неготовность руководства организации вкладываться в это направление и прочие сложности. Поэтому обязанности по управлению данными обычно ложатся на уже существующие роли, — рассуждает на тему кадровой проблемы Владимир Рождественский. — Единственная, на мой взгляд, должность, которую трудно совместить с уже существующими, это архитектор данных (Data Architect). Такой сотрудник должен видеть все предприятие „сверху“, видеть, как данные используются в каждом отделе и каждом подразделении. Аналогов в стандартном штатном расписании у этой роли нет».
Некие стандартные варианты решения кадровой проблемы просматриваются и в ответе Андрея Пивоварова. В частности, он разворачивает такой сценарий: «Первый кандидат на руководство вашей программой DG — инсайдер со сложившимися деловыми отношениями и глубоким знанием данных и внутренней работы организации. Такие кандидаты должны рассматриваться прежде всего при запуске программы DG». Второй вариант связан с наймом внешнего специалиста, обладающего опытом внедрения DG в другой организации: «И этот специалист первым скажет вам, что программы управления данными работают лучше всего, когда они определены, спроектированы, разработаны и развернуты с учетом принятой в организации культуры».
Он тоже в явной форме упоминает пока еще мало распространенную на российском рынке позицию Data Steward: «Это лицо, отвечающее за предметную область. Естественным выбором в качестве Data Steward, скажем, для HR-данных является специалист из отдела кадров, который любит работать с данными. Директор по маркетингу назначает Data Steward для домена маркетинговых данных и т. д.»
Михаил Александров полагает, что в процессе внедрения DG обязательно должны быть задействованы ИТ-специалисты, представители бизнес-подразделений, а также обозначенные выше специфические роли Data Scientist, Data Engineer и Data Architect. Но помимо привлечения широкого круга специалистов в компании должна существовать и специальная оргструктура, занимающаяся подобными вопросами: «Для реализации данной инициативы необходимо организовать DG Office, который будет отвечать за разработку правил и политик в области управления данными. Должен ли быть такой офис выделенной организационной структурой или его можно создать в виде рабочей группы — решение этого вопроса зависит от размеров компании. Аналогично решается и проблема организационного подчинения — есть различные варианты, когда роль CDO выделена внутри ИТ-службы или одного из бизнес-подразделений. Однако в крупных компаниях выделять CDO в самостоятельную структуру просто необходимо».
По словам Романа Стрекаловского, большая нагрузка, связанная с внедрением DG, придется на ИТ-департамент, сотрудники которого отвечают за данные, владеют бюджетом на R&D, закупку оборудования и ИТ-решений: «Вместе с тем переход к новым ролям в большинстве случаев — это повышение экспертизы, зоны ответственности, что ведет за собой и карьерный рост. Сотрудники ИТ-департаментов могут иметь слабое представление о том, как их решения влияют на отдел и на всю компанию в целом. Именно поэтому внедрение DG становится драйвером развития ИТ-департамента и всего предприятия».
«Во внедрении DG могут участвовать ИБ-специалисты, которые разрабатывают стратегии аудита доступа к данным. Активно вовлекаются и бизнес-пользователи, и ETL- и BI-разработчики, — говорит Егор Осипов. — Специалисты по автоматизации, безусловно, также принимают немалое участие в этих проектах, так как обычно они создают крупнейшие массивы данных на предприятии, ради которых и внедряется DG. При этом именно CDO является прямым бенефициаром этих изменений. Позицию Data Steward, например, редко можно встретить на предприятии до внедрения концепции, но практически на эту позицию может выйти как собственный, так и совершенно новый для компании сотрудник».
В целом резюме из всех приведенных мнений следующее. Наиболее часто упоминаемые экспертами позиции — CDO и Data Steward — относятся непосредственно к концепции DG. Позиции Data Scientist, Data Engineer, Data Architect также признаются значимыми, поскольку имеют прямое отношение к работе с данными в более широком смысле. Во мнениях экспертов вполне читается мысль о том, что штатная структура для имплементации DG существенно зависит от особенностей бизнеса предприятия и его масштабов.
Программная поддержка
Буквально все наши эксперты сходятся на мысли о том, что DG прежде всего являет собой бизнес-концепцию работы с данными, однако она все равно нуждается в информационной поддержке. Если не вдаваться во множество нюансов, вопрос будет звучать примерно так: должна ли эта поддержка быть специализированной или речь может идти о наборе более или менее традиционных инструментов, которые раньше могли служить иным целям?
«На самом деле возможны оба варианта, но с оговорками, — утверждает Михаил Александров. — Для полномасштабного внедрения DG и реализации всех необходимых процессов оркестровки все же необходимы специализированные инструменты. К таковым относятся: управление бизнес-метаданными или глоссарий, управление техническими метаданными, управление качеством данных, управление мастер-данными». Что касается вовлечения ИТ-специалистов, которые по сути необходимы при любой автоматизации, то для различных элементов ИТ-поддержки DG требуется разная степень такой вовлеченности. Особенно это важно там, где решение задачи сильно завязано на существующую ИТ-архитектуру и потоки данных.
«Безусловно, какие-то части DG присутствуют, например, в существующих ETL-инструментах (Data Lineage). Некоторые инструменты компания однозначно может разработать самостоятельно. Иногда наши заказчики этим и занимаются вплоть до внедрения полноценной стратегии DG, — комментирует Егор Осипов. — Но ценность возникает при внедрении комплексного решения, которое помогает выработать общую стратегию и индивидуальный подход к задачам».
Андрей Пивоваров выделяет восемь функциональных категорий, которые необходимо включить в управление метаданными и их курирование. Надо понимать, что среди них есть специфические, характерные именно для решения вопросов DG (такие, как управление Stewardship или оценка данных). Вместе с тем здесь есть и вполне «общеуправленческие» компоненты, которые всегда были характерны для большинства корпоративных систем (управление проектами и политиками, администрирование, безопасность).
«Продукты по хранению и обработке данных постоянно совершенствуются, а линейка узкоспециализированных инструментов расширяется, — считает Роман Стрекаловский. — Существуют основные инструменты DG: Metadata Management, Data Quality, Master Data Management, Information Lifecycle Management, Business Glossary, Data Lineage. Среди наиболее востребованных как на российском, так и на зарубежном рынках в этом списке я бы выделил Business Glossary (словарь данных), а также решение Data Lineage, позволяющее наглядно представлять связи и потоки распространения данных».
Методология — в основе всего
Детально обсуждать важнейший методический вопрос внедрения DG в рамках данной статьи вряд ли возможно, безусловно он требует особого разговора. Однако узнать мнение экспертов относительно ключевых универсальных методических акцентов нам представлялось вполне разумным. Среди таковых можно, например, выделить вопрос о целесообразности «подключения» к внедрению имеющихся наработок в области Data-, Document-, Content Management или иных ИТ-направлений. Интересно также узнать, можно ли имплементировать DG целиком или нужно развертывать отдельные его компоненты.
«Подход постепенного внедрения компонентов вполне разумен, да и мало кто может позволить себе внедрить сразу всё единым стеком, — считает Михаил Александров. — Например, можно начинать с внедрения процессов управления качеством данных и затем внедрять бизнес-глоссарий».
«Стоит начать с малого: с людей, политик и культуры, а затем переходить к DG, к процессам управления и технологиям, — утверждает Андрей Пивоваров. — Добейтесь поддержки со стороны руководства компании, привлеките ключевых лиц, принимающих решения в основных функциональных областях. Как можно раньше определите роли Data Steward и создайте команду Data Governance, в которую войдут эксперты по всем направлениям деятельности».
Андрей Орлов, очевидно, тоже имея в виду поэтапное внедрение, подчеркивает важность соблюдения последовательности всех шагов, которые необходимо сделать на этом пути: «Внедрение должно начинаться с первого шага и постепенно проходить по всем этапам. Если пропустить несколько шагов, то потом все равно к ним придется вернуться, так как есть ряд прямых зависимостей задач и основы, на которые они опираются».
«Внедрение технологий DG требует большой вовлеченности в процесс функциональных подразделений. Они знают бизнес-процессы и особенности работы с данными, что очень важно для успешного достижения поставленных целей, — считает Владимир Рождественский. — Но поскольку данная тема многогранна, обширна и до сих пор не очень четко сформулирована научным сообществом, поставить конечные цели полномасштабного внедрения не представляется возможным. Работа должна идти итерационно. Например, сначала можно сконцентрироваться на ETL-процессах, потом добавить MDM и следовать по этому пути дальше».
«Хотя методология управления данными относится к сравнительно молодым областям, для неё разработано несколько стандартов, которые можно взять за основу. В них могут быть по-разному расставлены акценты, где-то больше внимания уделяется разработке стратегии и связанным с ней инвестиционным вопросам, где-то приоритет отдаётся оперативному управлению и соответствующим технологиям. Но везде раскрываются понятия данных, жизненного цикла и качества, приводятся рекомендации и подходы к организации процессов управления данными. Технологии Data-, Document-, Content Management или иных ИТ-направлений могут упоминаться в качестве справочной информации», — говорит Юрий Бондарь.
Егор Осипов делает акцент на жестких требованиях к назначению ответственных за работу с данными: «Это не позволит сделать ИТ-службу виноватой за все ошибки. Методология требует тесного взаимодействия бизнеса с ИТ-структурой, а это большая работа, которая зачастую обуславливает необходимость в создании нового органа управления или консорциума по данным».