Тибо Сейролл, вице-президент филиала в EMEA стартапа Snowflake Computing, предоставляющего услуги по хранению и анализу данных, рассказfk на портале ComputerWeekly о значении облака для совместного использования данных внутри и за пределами предприятий.
Афоризм «данные — это новая нефть» по-прежнему остается истиной для многих организаций, поскольку возможности, скрытые в больших данных, открывают дорогу в реальность и позволяют компаниям добывать ценные инсайты, касающиеся их продуктов, сервисов и клиентов. По данным компании Wikibon, к 2026 г. глобальный рынок больших данных должен вырасти с 18,3 млрд. долл. в 2014 г. до невообразимой цифры в 92,2 млрд. долл., что обусловлено неуклонным ростом количества данных, генерируемых Интернетом вещей (IoT), социальными сетями и сайтами Интернета.
Традиционные архитектуры хранения данных и платформы больших данных типа Hadoop, выросшие из желаний обрабатывать большие массивы данных, сегодня начинают подавать признаки старения, так как скорости накопления, разнообразие и объемы данных круто растут вверх. Главной болевой точкой организаций, обрабатывающих большие данные, является вопрос минимизации задержек при генерации инсайтов. Ответ на этот вопрос следует искать в облачных технологиях, которые продолжают эволюционировать и подпитываться инновациями, и одно из возможных решений сегодня видится в совместном использовании данных.
Когда большие данные проходят через специализированные облачные платформы хранения данных, не так уж сложно организовать их совместное использование в реальном времени как внутри одной организации, так и несколькими организациями и помочь всем вместе быстро реагировать на рынок. Возможности облака позволяют организациям делиться своими данными безопасным и управляемым образом, покончив с изолированностью процессов получения инсайтов, которая является одной из причин задержек.
В прошлые времена анализ массивов данных препоручался ИТ-департаменам или группам специалистов по сбору и анализу бизнес-информации, работающим внутри организации. Однако продолжающийся рост объемов данных и их значения для деятельности организаций вызывает перемены в потребностях бизнеса.
В компаниях, работающих на базе данных, идет процесс демократизации данных, и они становятся достоянием всех работников. Подразделения разного профиля, будь то отделы продаж, маркетинга или юридические департаменты, в равной мере нуждаются в легком и быстром доступе к данным, однако старые архитектуры больших данных этому мешают.
Использование облаков позволяет эффективно поддерживать параллельно работающих пользователей, и благодаря этому любой работник организации от младших должностей до уровня руководства может получать из данных целостные инсайты, помогающие вникать в бизнес и понимать интересы клиентов.
Добавим, что устаревшие внутренние решения плохо справляются с обработкой крупных массивов данных, и на то чтобы обработать данные и извлечь из них нужную информацию у организаций зачастую уходят дни и даже недели. Затем эти данные приходится переправлять в другие места назначения.
Облако сегодня стало пространством, на которое можно делать ссылки, и с ним можно обращаться наподобие Интернета. Аналогично тому, как мы получаем нужную информацию, посещая веб-сайты, облако можно использовать как транзитный хаб для быстрого доступа к данным.
Совместное использование данных не только ускоряет извлечение инсайтов, но и способствует улучшению взаимодействия между разными подразделениями и филиалами и усовершенствованию способов коммуникаций. Возьмем, к примеру, многонациональные компании, которые часто разбиты на множество отделений или имеют персонал, работающий в различных точках мира. В этом случае совместное использование данных на базе облака поможет соединить отдельные подразделения, избавившись от дублирования процессов извлечения инсайтов работниками разных регионов.
Поскольку объемы данных растут от года к году, одновременно развиваются и формы коллективной работы с данными. Жажда эффективного использования данных подводит организации к внедрению машинного обучения, которое может помогать в просеивании гор поступающей информации.
Перед организациями, сделавшими ставку на машинное обучение, также открываются лучшие возможности для интеграции имеющихся источников данных в единое целое, выполняющее функции объединенной сети данных. Основная масса отбираемых данных находится в облачных источниках, и организации могут использовать машинное обучение для всестороннего анализа поведения клиентов. Учитывая их предпочтения, организации могут более целенаправленно создавать конкретные продукты и сервисы.
Крупнейший мировой ритейлер Walmart взрастил свою империю на основе обработки больших данных и использования машинного обучения для максимально тесного контакта с покупателями. Благодаря прогнозной аналитике торговые центры Walmart могут предугадывать вариации покупательского спроса в разные часы и дни и регулировать число работающих кассовых терминалов для лучшего обслуживания посетителей. Другие сети розничной торговли, например Tesco, тоже используют машинное обучение для лучшего понимания поведения покупателей при выборе продуктов в электронных каталогах.
Рост экономики совместного использования данных в перспективе еще выше поднимет значение данных как нового ресурса развития цивилизации. Облачные технологии работают рука об руку с большими данными не только как средство для извлечения инсайтов, но и как фундамент для взаимодействия и связей между всеми сторонами экосистемы бизнеса. С углублением интереса организаций к облакам и машинному обучению бизнес-решения будут все прочнее опираться на данные, и это откроет небывалые возможности быстрого отклика на запросы людей.