Разработка приложений становится компонуемой. Принято считать, что огромные монолитные приложения должны быть разбиты на более мелкие, отдельные сервисы, доступ к которым осуществляется через веб-сервисы и API. Но как быть с анализом данных и огромными массивами данных, на которые он опирается? Генеральный директор GoodData Роман Станек считает, что с этой задачей должна справиться компонуемая аналитика (composable analytics), которая позволяет обрабатывать данные в режиме реального времени и интегрировать их в едином облачном хранилище. Его мнение приводится на портале Datanami.
Gartner является одним из ведущих сторонников идеи компонуемой аналитики. В отчете «Composable Analytics Shapes the Future of Analytics Applications», датируемом сентябрем 2020 г., аналитик этой компании Джулиан Сан написал следующее: «Многие компании внедрили встроенную аналитику, чтобы приблизить аналитику к бизнес-процессам и улучшить процесс принятия решений. Микросервисы или облачные инструменты добавляют гибкости и позволяют пользователям быстрее получать бизнес-ценности. Расширенная аналитика становится все более распространенной, что дает возможность встраивать в бизнес-процессы более продвинутые аналитические возможности, выбранные из аналитического стека».
По словам Станека, сочетание большой вычислительной мощности и огромных массивов данных в облачных хранилищах создает условия для того, чтобы пользователи могли получать аналитические данные через API, оставив в прошлом громоздкие настольные BI-инструменты и пакетную передачу данных.
«С нашей точки зрения, и мы не единственные, кто так считает, будущее за тем, что Gartner называет компонуемой аналитикой, а мы — Headless BI. API-ориентированная аналитика — слой, который позволяет всем вашим потребителям, внутренним и внешним, использовать какой-либо инструмент Low-code/No-code для создания собственных приложений, аналитических данных, дашбордов и т. д. Это рационализация аналитики для придания ей формы реального времени и более облачной основы — вместо того, чтобы копировать данные из Teradata и Tableau и делать какой-то локальный или настольный анализ, помещать его в PDF-файл и отправлять людям по э-почте», — поясняет Станек.
Недавно Pulse (дочерняя компания Gartner) провела по заказу GoodData исследование «The Future of Analytics: Priorities and Plans for Business Analytics in 2022 and Beyond». Его основой послужил опрос 200 лиц, принимающих решения в компаниях с численностью от 500 до 10 тыс. сотрудников. Как показали результаты опроса, приоритетом номер один в аналитике в 2022 г. станет предоставление аналитических решений самообслуживания (Self-service BI) и дашбордов (как и в 2021 г.), далее следуют масштабируемые архитектуры и обновление данных в режиме реального времени.
Это особенно актуально для небольших компаний или компаний с числом сотрудников менее 10 тыс. Компании с бóльшим количеством сотрудников имеют отдельные команды, занимающиеся аналитикой (либо ИТ-отдел, либо специальная команда по данным и аналитике), говорится в отчете, в то время как в небольших компаниях за аналитику, как правило, отвечает каждый отдел.
Для крупных компаний приоритетом номер один стало машинное обучение. Чтобы добиться демократизации данных, необходимо внедрить возможности их анализа в длинный «хвост» компаний с числом сотрудников менее 10 тыс. человек. Компонуемая аналитика, или Headless BI, представляет хороший механизм для этого, утверждает эксперт.
«Это очень похоже на то, как вы используете Gmail. Вы не переносите его на свой рабочий стол. Вы просто используете облачный сервис, — говорит он. — При такого рода использовании Headless BI и компонуемой аналитики я не переношу данные на свой рабочий стол. На самом деле я использую некий легкий пользовательский интерфейс и манипулирую данными в облаке, в Snowflake, Redshift, Databricks и т. д.».
Свою роль в этой новой области аналитики должна сыграть не только точка потребления аналитических данных, т. е. дашборд, но и другие участники вспомогательного процесса — инструменты ETL или инструменты декомпозированного извлечения, преобразования, интеграции и качества данных.
«Мы называем это цепочкой создания ценности облачных данных, — объясняет Станек. — Мы переходим к новой парадигме, когда облачное хранилище становится центром притяжения данных. Данные ни в коем случае не перемещаются из него. Вы все делаете в этом месте». По его словам, не имеет значения, находятся ли некоторые данные в облачном хранилище или в озере данных или же пользователь хочет запросить их с помощью аналитического инструмента или блокнота машинного обучения. Если работа по интеграции завершена, и встроенное приложение готово, оно позволит пользователям быстро получить доступ к данным и стать продуктивными быстрее, чем это было возможно ранее.
«Главное преимущество — это работа в режиме реального времени. Вы не имеете дела с несвежими данными, которые вам пришлось копировать, — говорит Станек. — Кроме того, поскольку это облачная система, сотрудничать гораздо проще, так что вы работаете с теми же наборами данных, с которыми работает кто-то другой. Вы можете создать приложение и поделиться им с остальной частью компании».
Как бы это не называлась — компонуемой аналитикой или Headless BI, похоже, что это окажется востребованным решением в ближайшей перспективе.