Наборы данных о пандемии COVID-19 стали доступными для всех и, что еще более важно, их предварительно группируют, что упрощает работу с инструментами визуализации и анализа. Таким образом, работать с ними и получать достоверную информацию о ситуации с коронавирусом могут даже непрофессионалы.
Как сообщает портал ZDNet, поставщики технологий предлагают ряд инструментов для анализа, что позволяет эпидемиологам, а также непрофессионалам в кратчайшие сроки агрегировать и обрабатывать данные о COVID-19. Как следствие, эта пандемия может стать самой визуализированной из всех когда-либо виденных до этого. Первая информационная панель для агрегации и анализа данных появились вскоре после вспышки вируса в Китае. Ее подготовил университет Джона Хопкинса. Доступ к ней был открыт 23 января.
Панель визуализирует данные, полученные из ВОЗ, Центров по контролю и профилактике заболеваний США (Centers for Disease Control and Prevention), Европейского центра профилактики и контроля заболеваний (European Centre for Disease Prevention and Control), национальной комиссии здравоохранения КНР (National Health Commission of the People’s Republic of China), трекеров реального времени 1point3acres, DXY и Worldmeters.info, новостного агрегатора BNO, государственных и национальных правительственных департаментов здравоохранения, а также сообщений местных СМИ. Университет Джона Хопкинса также выкладывает данные на GitHub для общего пользования. Его панель мониторинга стала самым визуализированным набором данных о пандемии.
Несмотря на то, что данные о COVID-19 доступны во множестве источников, в последнее время упор делается на предоставлении чистых данных для анализа.
Сбором, анализом и визуализацией данных COVID-19 занимаются следующие ресурсы:
- Tableau выпустила панель мониторинга Starter Dashboard, взяв за основу данные университета Джона Хопкинса. Компания берет на себя их подготовку, предоставляя данные в различных форматах и шаблонах визуализации;
- для отслеживания ситуации с COVID-19 Esri использует свой опыт в области картографии и геолокации. Компания также локализует данные о случаях заболевания COVID-19 и объединяет их с данными о наличии свободных больничных мест, которые предоставляет компания Definitive Healthcare, занимающаяся сбором и анализом данных в области здравоохранения. Панель мониторинга Esri работает на базе ее же ПО ArcGIS Business Analyst и дает моментальный снимок о готовности округа реагировать на пандемию;
- открытые наборы данных также приносят пользу. Исследователи и авторы издания Atlantic собирают данные из многочисленных источников, используя ПО на базе Open Source;
- собственными наборами данных о коронавирусе располагают GitHub, а также data.world и Kaggle. Последний проводит конкурсы по исследованию данных, строит прогнозы и обладает средствами визуализации;
- на Reddit имеется раздел Data is Beautiful — место, где свои визуальные образы выкладывают как любители, так и специалисты по данным. Our World in Data владеет обширной базой статистики, исследований и данных по COVID-19;
- платформа Snowflake, которая оказывает услуги по хранению данных в облаке, объявила о том, что поставщик услуг в области данных Starschema поместил в ее облаке бесплатный набор данных, который призван стать источником достоверной информации о заболеваемости и смертности в результате COVID-19. Этот набор может быть дополнен информацией о плотности населения и географическом положении;
- IBM интегрировала данные о COVID-19 с приложением Weather Channel, которое помимо данных о погоде предоставляет картину с распространением коронавируса во всем мире, используя доступные данные, статистику и многое другое. С помощью Weather Channel дочерняя компания IBM сможет передавать соответствующие данные о COVID-19 своим 300 млн. активных ежемесячных пользователей. Отображение данных в виде визуальных источников улучшает их понимание. IBM это хорошо понимает, двигаясь по стопам Google и Microsoft Bing, которые стремятся донести информацию о коронавирусе до широких масс.
Что касается российских ресурсов, то они также идут в ногу со временем. Карты распространения COVID-19 в России предлагают, в частности, сервисы 2ГИС и «Яндекс». 2ГИС использует официальные данные Роспотребнадзора, которые обновляются в режиме реального времени. Ресурс показывает общее число зараженных коронавирусом в России, а также данные по городам и регионам. По аналогии с пробками на дорогах «Яндекс» присваивает рейтинг уровню самоизоляции россиян в разных городах. Для этого компания сравнивает уровень городской активности в текущий момент и в обычный день — до введения карантинных мер. При этом виджет с индексом самоизоляции уже можно увидеть в «Яндекс.Картах» для городов с населением свыше 100 тыс. человек, но в скором времени он будет доступен и для городов с населением от 50 тыс. человек.