Фейковые факты, дискриминация, сложность и безграмотность — это четыре проблемы, которые должны преодолеть CIO и специалисты по данным, чтобы эффективно использовать аналитику. Все эти вопросы обсуждались на недавней конференции Gartner.
«Сегодня наступает время лидеров, организующих в компаниях работу по исследованию данных и аналитике», — заявила Рита Соллем, вице-президент Gartner по исследованиям и распорядитель конференции Gartner Data & Analytics Summit 2018, состоявшейся в марте в Техасе. По данным Gartner, компании, сумевшие наладить эффективную работу с информацией, имеют вдвое более высокую рыночную стоимость по сравнению со средними показателями. Но, вместе с тем, данные, по мнению многих экспертов по информации, ныне становятся средой для информационных атак. «Поскольку фейковые новости в сущности являются фейковыми данными, то есть предметом нашей компетенции, первостепенной задачей специалистов по данных становятся обеспечение качества данных и создание фундамента для доверия», — считает Соллем.
Соллем и ее коллеги по Gartner предупредили участников конференции о необходимости справиться с четырьмя сложными проблемами, встающими на пути компаний, начинающих активно работать с данными. Речь идет о том, чтобы:
- создавать доверие к данным;
- опираться на многообразие людей, профессий и типов данных;
- управлять сложностями через автоматизацию;
- создавать программы грамотности в использовании данных.
В рекомендациях Gartner по решению этих проблем, как и в упоминании Соллем фейковых новостей, содержались провокативные элементы. Например, в разделе, посвященном многообразию, были затронуты темы приема на работу людей с аутизмом и правосудия с использованием алгоритмов искусственного интеллекта. В разделе по грамотности обсуждалось, правомерно ли, не проводя предварительного тестирования на наличие у сотрудников навыков работы с данными, разрешать им использовать корпоративные данные для принятия бизнес-решений.
Какие еще откровения прозвучали в главном докладе? Бимодальная модель ИТ (этот термин был запущен Gartner в оборот в 2014 г. для обозначения двухуровневого подхода к ведению цифрового бизнеса предприятий) уже не является достаточной.
По словам вице-президента Gartner по исследованиям Курта Шлегеля, последние три года компания активно пропагандировала, чтобы ИТ-отделы использовали бимодальную стратегию, предполагающую два вида работ: один для хорошо отработанных процессов, поддерживающих ведение бизнеса, и другой для деятельности небольших групп, занимающихся динамичными разработками и инновациями. И многие организации взяли эту стратегию на вооружение. «Но, увы, мы уперлись в стену», — сказал Шлегель. Интеграция этих двух моделей оказалась труднореализуема. Он указал на возможность использовать новую форму работы в духе краудсорсинговых проектов, на базе средств автоматизации и методов искусственного интеллекта, таких как машинное обучение и обработка естественного языка. Чтобы усилить роль данных и аналитики, надо перейти от ручных процессов, выполняемых малым числом людей, к автоматизированным процессам, доступным многим.
Разберем более конкретно четыре вышеупомянутые задачи и меры, рекомендуемые Gartner для их решения.
Создавать доверие. Те, кто руководят работой с данными и аналитикой, не должны недооценивать риски намеренного распространения ложной информации, отмечает Шлегель. «Это отнюдь не только сфера политики. В сегодняшнем мире мошенники используют все более изощренные методы фишинга и, сфабриковав какой-нибудь подлог, могут обмануть почти любую компанию».
Компании зачастую без разбора запускают в обработку все поступающие данные, и это ставит организации перед серьезными рисками. Чтобы принимать правильные решения, мы должны научиться проверять наши данные. Противоядием к этой слепоте являются метаданные — но не те элементы формального описания, из которых компилируются никем не читаемые бизнес-глоссарии. Чтобы обеспечить достоверность используемых данных нужна динамичная коллективная работа.
«Необходимо, чтобы рядовые пользователи умели описывать тегами то, с чем они имеют дело, непременно включая в них информацию о происхождении данных, — советует Шлегель, отмечая, что этим постоянно занимаются пользователи социальных сетей. — Мы можем делать то же самое, внедряя более динамичный подход к обеспечению достоверности данных».
Культивировать многообразие. Многообразие должно стать базовым принципом нашей деятельности, и это не просто правильный, а абсолютно необходимый подход для реализации эффективных программ исследования данных и аналитики, считает Карли Айдойн, директор Gartner по бизнес-аналитике и науке данных.
Опубликованный в 2018 г. отчет McKinsey сообщает, что организации, относимые к верхнему квартилю по этническому и культурному многообразию состава управленцев, в среднем имеют на 33% более высокую прибыльность, чем находящиеся в нижнем квартиле. А согласно одному из последних исследований Gartner разнородные по составу команды реализуют свои инициативы по аналитике данных с большей эффективностью для бизнеса. «Разнородные команды работают лучше, чем однородные, и это очень важный результат исследований», — отмечает Айдойн.
Еще одной причиной для расширения практики найма кадров является дефицит способных специалистов по аналитике данных, и этот серьезный фактор требует, чтобы организаторы работы по исследованию данных и аналитике использовали более широкие подходы, чем гендерный или этнический паритет.
«Надо признать, что в практике найма персонала существует определенное предпочтение брать на работу внешне ярких и успешных людей. Но не все достойные кандидаты вписываются в этот образ, — говорит Айдойн. — Набирая команду из способных людей разного типа, включая пол, расу, возраст и стиль работы, интравертов и экстравертов, и не допуская малейшей дискриминации людей с проявлениями аутизма, вы сможете сформировать гораздо более эффективную группу для работы с данными и аналитикой».
Многообразие источников данных наряду с разнообразием людей, работающих в составе команды, поможет снизить вероятность создания алгоритмов, искаженных человеческой предвзятостью, добавила Айдойн, сославшись на научную статью Кэти О’Нейл по деструктивными алгоритмам.
Управлять сложностью. По словам Шлегеля, чтобы справиться с разнообразием данных, в которых нуждается современный бизнес, необходимо расширять программы аналитики и ускорять темпы их реализации.
«Трудность состоит в том, чтобы создать программу исследования данных и аналитики в идеальном балансе между динамичной креативностью и корпоративной масштабируемостью», — сказал он. Сюда не подойдут ни бимодальная ИТ-модель, ни традиционно последовательный стиль работы в сфере BI, когда один специалист завершает свою часть и передает работу следующему.
«Хотя метод сборочной линии зачастую бывает эффективен, для наших нужд он недостаточно творческий и слабо использует коллективную работу», — считает Шлегель.
Для решения сложных проблем в сфере аналитики целесообразно формировать много небольших групп, которые в условиях малого риска будут разрабатывать низкозатратные прототипы. По словам Шлегеля, это разновидность краудсорсинга, повышающая шансы создать нечто достаточно крупное и мощное, чтобы справиться с теми сложностями, которые встают перед организацией.
Формировать грамотность в данных. Мы не разрешаем людям садиться за руль автомобиля без сдачи экзамена на получение водительских прав. «Разве это не безумие предоставлять пользователям доступ к критически важным для бизнеса данным без всякой сертификации? Как говорится, с большой силой приходит и большая ответственность», — отмечает Айдойн.
Для расширения своих аналитических программ компаниям желательно привлекать к делу практиков по работе с данными, не относящихся к категории специалистов по данным (Gartner называет их citizen data scientists), из числа своего персонала и предоставлять им автоматизированные инструменты для неспециалистов, помогающие извлекать бизнес-инсайты. Однако, считает Айдойн, обязательным условием является проведение определенной сертификации для доступа к данным. «Так же, как бывают разные типы прав на вождение разными видами транспорта, мы должны иметь дело с разными уровнями образования, обучения и тестирования разных типов пользователей и практиков по работе с данными». Для успешного бизнеса в условиях цифровой экономики важна грамотность в области данных. Средневековые монахи делали важную работу для сохранения грамотности, записывая летописи и переводя древних классиков, но, чтобы грамотность входила в массы, потребовался технологический прорыв в виде начала книгопечатания.
Аналогично этому, говорит Айдойн, для грамотности в области данных потребуется технологический катализатор. Инструменты категории Data Discovery, некогда рассматривавшиеся как путь к демократизации аналитики, оказались слишком ручными. Вместо этого Айдойн убеждала участников конференции осваивать то, что Gartner называет дополненной аналитикой, под которой понимается применение средств Data Discovery в пакете с автоматизацией в виде машинного обучения и использования естественного языка. Автоматизация поможет пользователям вырасти в ответственных практиков по работе с данными и сформировать культуру грамотности в данных.