Аналитики Gartner на региональном (EMEA) саммите «Data and Analytics» рассказали об ошибочности накопления данных как самоцели, о значении метаданных, ткани данных и малых данных, а также о четырех сценариях развития бизнеса в социуме, сообщает портал ComputerWeekly.
Последние пару лет работники умственного труда из-за пандемии трудились из дома, но сейчас пришло время отдать предпочтение креативности и инновациям, заявили аналитики Gartner, проведя различия между этими двумя понятиями. «Нам нужны инновации, которые выходят за рамки креативности и заключаются в наличии отличной идеи; иными словами, инновации означают использование этой идеи для стимулирования изменений, — сказала Алис Вудворд, старший директор группы новых технологий и тенденций Gartner. — Компании, которые лучше всего справляются с неопределенностью, успешнее ориентируются в будущем». По словам Эрика Бретено, руководителя ключевых инициатив в группе ИИ Gartner, самая большая проблема предприятий заключается в том, чтобы использовать анализ для стимулирования изменений.
Дуэт экспертов исследовал, как управление данными помогает или мешает инновациям и как «мышление больших данных» мешает извлечению бизнес-ценности из данных. По их словам, облачные технологии поощряют вредную привычку накапливать как можно больше данных. Однако данные — это, прежде всего, ответственность. «Забрать все данные — это не стратегия, — заявила Вудворд. — Нам нужны данные, которые делают нас умнее».
Эксперты подчеркнули ценность метаданных (данных, описывающих данные), к которым применяется машинное обучение, чтобы организации лучше понимали, какие данные у них есть. Они также высоко оценили ценность ткани данных, под которой они подразумевают архитектуру управления данными, объединяющую децентрализованные активы данных.
Малые данные
Специалисты Gartner проанализировали идею малых данных, основанную на минимально жизнеспособной модели. «Насколько инновационными мы можем быть в определении наименьшего количества данных, которые нам необходимо знать?», — поставил вопрос Бретено.
Вудворд перенесла аргументацию на синтетические, искусственно созданные данные, которые имеют схожие атрибуты с данными, которые они имитируют. По ее словам, ценность этого метода заключается в том, что он снижает ответственность, связанную с хранением конфиденциальных данных. Она привела пример компании, которая использует данные о транзакциях для создания синтетических наборов данных, чтобы поделиться ими со сторонними разработчиками моделей без риска для конфиденциальности своих клиентов.
Синтетические данные также, по ее словам, позволяют организациям «двигаться быстрее и заполнять пробелы в фактических данных», что важно для построения моделей МО. По оценкам Gartner, к 2030 г. синтетические данные практически полностью заменят реальные данные в моделях ИИ.
Инновации требуют импульса
«Мне показалось интересным, что аналитики Gartner заговорили об инновациях, — сказал Стивен Бробст, CTO Teradata. — Я заметил, что во время пандемии производительность большинства организаций выросла, в основном потому, что их сотрудники научились работать дома, у них не было двухчасовых поездок на работу каждый день, и им нечем было заняться, кроме работы».
Несмотря на то, что у людей стало больше времени, чтобы «доводить дела до конца», инновации пострадали. «Сейчас мы снова собираемся вместе, нам нужен импульс, который возникает между инженерами за интерактивной доской в споре о том, как решить какую-то проблему. Трудно вообразить, что он возникнет за работой на двухмерном экране. Люди — социальные животные, и единение на самом деле создает идеи, инновации и сотрудничество», — добавил он.
Четыре сценария развития бизнеса в социуме
Франк Байтендайк, почетный сотрудник группы данных и аналитики Gartner, и Питер ден Хамер, старший директор компании по исследованиям, подчеркнули неизбежную социальную природу контекста, в котором работает бизнес. Они указали на существующую общую картину социальной фрагментации и связанные с этим риски для бизнеса. «Социальные разрывы происходят, когда мы не взаимодействуем друг с другом, когда мы взаимодействуем только поляризованным образом или когда мы действуем негативно по отношению к общему благу», — пояснил Байтендайк.
Руководители в области данных и аналитики должны осознавать четыре возможных варианта развития событий для бизнес-организаций, которые сводятся к следующему: принять господствующую точку зрения, играть на свое усмотрение, не лезть не в свое дело и выжидать. Первое, говорит Хамер, — это расчет на то, что общество снова станет более сплоченным и будет знать и выражать то, чего оно хочет. При таком сценарии специалисты в области данных будут делать акцент на сотрудничестве и управлении, которые лежат в основе этого. Здесь речь об ответственном ИИ и инициативах ESG — они станут более важными в ответ на усиление госрегулирования.
Второй сценарий, по словам Байтендайка, хорошо иллюстрируется феноменом разделения бизнеса по религиозному признаку (для католической и протестантской общин) в Утрехте
Третий сценарий — не лезь не в свое дело, — по словам Хамера, возвращает нас в мир, где коммерческие компании просто игнорируют голос общества. Здесь усталость от всех разговоров о более широкой социальной цели уступает место чистому капитализму для акционеров. В этом режиме бизнес должен сосредоточиться на продуктах и услугах, а более широкие разговоры оставить другим.
Последний сценарий — выжидание, — является, по словах Байтендайка, «самым странным, потому что общество знает, чего оно хочет, но ничего не происходит». Здесь контекстом может быть огромный экономический кризис. Для специалистов по данным и аналитике этот сценарий означает инвестирование в аналитику социальных сетей.
Компании должны принимать меры по решению социальных проблем, независимо от того, какой сценарий им наиболее близок. Для лидеров в области данных и аналитики, сказал Хамер, сценарий «принять господствующую точку зрения» означает, что они должны использовать свой опыт на благо общества; для приверженцев принципа «играть на свое усмотрение» — использовать аналитику, чтобы лучше узнать своих клиентов; для неолибералов сценарий «не лезть не в свое дело» означает использовать данные для максимизации прибыли; и для четвертого сценария данные и аналитика играют роль раннего предупреждения.