Многие организации применяют системы управления данными и анализ информации для того, чтобы максимально эффективно использовать данные, которые они генерируют. Ценность данных перманентно вырастает. Понимая это, предприятия изучают возможности для внедрения новых инструментов на базе машинного обучения, однако внутренние данные ограничивают потенциал компании — подключив к своим инструментам аналитики внешние источники данных, организации могут значительно повысить эффективность своей работы, отмечают опрошенные порталом InformationWeek эксперты. Как показал проведенный в 2018 г. опрос Gartner, участниками которого стали 196 организаций, внешние источники данных задействуют 46% из них.
Наиболее распространенным примером этого является подключение к аналитическим инструментам источников метеосведений, что помогает ритейлерам спрогнозировать повышенный спрос на определенные продукты в определенное время: если предвидится снежная буря, то это будут лопаты для снега, если ожидается повышенная солнечная активность, то тогда это могут быть солнцезащитные средства. В свою очередь страховые компании могут информировать своих клиентов о подготовительных действиях, которые необходимо предпринять, чтобы предотвратить порчу имущества от надвигающейся бури, например, перегнать автомобили в более безопасное место.
Тем не менее, приобретение данных — это пока что относительно новая практика. С одной стороны, многие организации регулярно закупают сторонние данные, с другой — не существует крупного, заслуживающего доверия поставщика данных, как не существует самого рынка проверенных, качественных наборов и потоков данных. В итоге, если у организации имеется набор данных, который представляет определенную рыночную ценность, ей некуда обратиться с этим предложением ввиду отсутствия единого центра обмена информацией, который бы поручился за ее качество и помог бы найти на нее покупателя.
Однако ситуация начинает улучшаться, считает управляющий директор по анализу новых технологий и тенденций в бизнесе Deloitte Consulting Дэвид Шацки: «Рынок поставщиков данных начал приобретать очертания законченности: появляется довольно много начинающих игроков, приходят новые специализированные поставщики». Он призывает организации развивать компетенции на этом рынке, начать нужно с поиска источников данных, которые наделяют их преимуществами в сравнении с конкурентами: «Это напоминает поиск новых технологий, но только в этом случае они будут заниматься поиском новых источников данных».
Найдя источник данных, организации следует приступить к проверке качества образцов данных, в том числе на предмет соответствия другим данным, которые имеются в ее распоряжении. Вдобавок организации должны быть ознакомлены с любыми правилами или ограничениями, касающимися данных, которые они покупают или продают, и правами собственности на них. Для этого специалистам, которые отвечают в организации за покупку/продажу данных, потребуется наладить связь с экспертами по праву. Дело в том, что в некоторых случаях, чтобы получить представление о содержащейся в данных ценности, не обязательно их покупать.
Приобрести данные можно у дата-брокеров, которые собирают их из нескольких источников и предлагают в виде готового набора. К нему относят набор расширенных данных, которые были получены за счет применения аналитических правил и вычислений (подсчет объектов, тэгирование и др.). Кроме того, существуют службы, которые принимают от организаций данные с конкретными аналитическими запросами, и затем для получения информации сличают их с данными из других источников.
По словам Шацки, команда, занимающаяся оценкой и обработкой внешних данных, должна возглавляться директором по данным (chief data officer) и иметь налаженные связи с бизнес-, ИТ- и юридическим подразделениями. Также компаниям следует «думать о себе как об элементе экосистемы данных, которая состоит из сети участников, которые прямо или косвенно потребляют, производят или предоставляют данные и другие связанные ресурсы».
Шацки считает, что сейчас для предприятий наступило самое подходящее время для формирования команды специалистов для анализа и управления внешними данными, что связано с набирающими популярность методами машинного обучения и искусственного интеллекта. «В мире постоянно появляются новые технологии, и значимое место здесь отводится корпоративным инновациям. Что касается технологии ИИ, то для ее корректной работы требуются данные. В настоящее время ИИ стала важной частью инновационной стратегии компаний», — сказал он.