Алан Джейкобсон, директор компании Alteryx по данным и аналитике, рассказывает на портале Information Age, почему наука о данных дает основания для оптимизма во время кризиса.
Наше время не имеет прецедентов. При плавании по неизведанным водам хорошая информация, хорошие данные и возможность принимать хорошие решения на основе аналитики важнее, чем когда-либо. В ходе борьбы с новым коронавирусом COVID-19 обсуждался широкий спектр сценариев использования науки о данных. В некоторых случаях такие сценарии разрабатывались и использовались. Одни из них получили бóльшую известность, другие меньшую, но общим для всех является способность внушить нам некоторую надежду, что технология позволит выйти из кризиса.
Хотя всем велено держаться подальше друг от друга, нам более чем когда-либо необходимы сплоченность и объединение усилий, чтобы справиться с проблемой. Мы сможем добиться этого только в том случае, если будем делиться своими решениями и совместно разрабатывать новые. Вот некоторые способы использования науки о данных для улучшения результатов работы.
Создание лекарств с помощью искусственного интеллекта
Недавно организация Sage Health спонсировала конкурс Drug Discovery Competition. В трех наиболее интересных заявках протокол лечения разрабатывался с помощью машинного обучения. Некоторые фармацевтические компании также используют технологии на основе ИИ для обнаружения новых и существующих молекул, которые можно применять для борьбы с COVID-19. Главное из имеющихся лекарств (Remdesivir) сейчас оценивается в ходе нескольких испытаний.
Американское правительство и ряд ведущих исследовательских групп подготовили открытый набор данных CORD-19 (47 тыс. научных статей), предоставляющий возможность использовать обработку естественного языка и другие приемы ИИ, поскольку быстрый рост числа публикаций о коронавирусе не позволяет медикам следить за всеми достижениями в борьбе с COVID-19.
Камеры для распознавания лиц с автоматическим измерением температуры и обнаружением масок
В Китае власти измеряют температуру собравшихся в людных местах. Те, у кого температура повышена, проходят дополнительное обследование, могут получать лечение и помещаться в изоляцию. Кроме того, теперь многие камеры способны идентифицировать личность и определять наличие или отсутствие маски, которую в некоторых странах требуют носить в общественных местах, чтобы способствовать соблюдению карантина.
Использование фитнес-браслетов для отслеживания распространения заболевания
В феврале 2020 г. в издании The Lancet исследователи задались вопросом, могут ли использоваться устройства для фитнеса, такие как фитнес-браслеты, для отслеживания распространения болезней. Хотя это исследование из области науки о данных не имело в виду коронавирус, оно показало, что можно точно отслеживать распространение заболевания с помощью мониторинга и анализа изменений частоты сердечных сокращений в покое. А поскольку некоторые носимые устройства собирают дополнительную информацию, такую как пульсоксиметрия, ЭКГ или даже распознавание кашля, можете себе представить, каким может быть дальнейшее развитие.
Использование сотовых телефонов для прогнозирования распространения инфекции и изолирования подверженных риску людей
Южная Корея, Китай и Италия используют смартфоны для управления карантином. В Китае данные с сотовых телефонов служат основой для прогнозирования потенциальных новых вспышек заболевания. Идентифицируя заразившихся и анализируя их предшествующие передвижения с помощью сервисов локализации их телефонов, можно увидеть, кто еще может быть подвержен опасности заражения и в каких зонах такая опасность наиболее вероятна. Моделируя эти данные, китайское правительство сумело спрогнозировать, какие зоны (кварталы и города) подвержены наибольшему риску и кто больше всего выиграет от введения проактивного карантина. В США тоже обсуждается возможность использования данных такого типа.
Быстрое распространение информации
Правительства, компании и неправительственные организации быстро собирают данные и обмениваются ими. Но есть инстанции, для которых такое сотрудничество имеет особое значение. На Тайване правительство быстро сделало историю перемещений пациентов доступной для больниц, чтобы можно было более точно оценить риск. Другая информация, например, о местах, которые посещали зараженные, широко рассылалась. Тех, кто побывал в этих местах, просили вести мониторинг своего самочувствия и при необходимости соблюдать карантин.
Диагностика с помощью компьютерной томографии и ИИ
ИИ применяется для обнаружения признаков COVID-19 на КТ-снимках легких пациентов.
Обман системы: непредвиденный результат аналитики
После начала пандемии COVID-19 китайским студентам предложили загрузить приложение DingTalk для получения инструкций и заданий во время карантина. Те быстро сообразили, что DingTalk будет удалено из магазина приложений, если они совместными усилиями понизят его рейтинг. 11 февраля 2020 г. 15 тыс. человек присвоили ему рейтинг в один балл, снизив общий рейтинг с 4,9 до 1,4. Это оказалось очень умным ходом, ориентированным на аналитику с использованием рейтингов. Стремясь вернуть студентов в качестве пользователей, компания DingTalk выпустила юмористический видеоролик с извинениями. В конечном итоге, приложение продолжает использоваться. Но всегда полезно подумать о последствиях использования аналитики разными способами и о возможных непредвиденных результатах.
Управляемая данными реакция
Наука о данных и аналитика должны играть главную роль в решении наиболее сложных мировых проблем, таких как пандемия коронавируса. Сейчас нам необходимо быстро реагировать на развитие событий и уважать друг друга. К сожалению, пандемия может продолжаться долго. Но если мы объединим наши усилия, то со временем, можно надеяться, будем более оптимистично смотреть на вещи.