Крупные транснациональные корпорации, в т. ч. Facebook и Google уже неоднократно попадали в скандалы, связанные с утечками или косвенной торговлей персональными данными, что поднимает много трудных вопросов об этике использования данных. Старший специалист по данным компании Metis Софи Сиэрси на портале InformationWeek рассуждает о том, как предотвратить манипулирование данными.
Обеспокоенность этими вопросами напрямую связана с ошеломляюще быстрым ростом объемов личных данных, которые обрабатываются ИИ-алгоритмами, и оказываемым последними влиянием на то, какую рекламу нам показывать — алгоритмы научились даже подсказывать, какого партнера предпочесть в приложениях для знакомств. Возрастающее влияние алгоритмов на принятие повседневных решений людей вызывает серьезную обеспокоенность экспертов по поводу рисков манипулирования данными.
Между тем, пока политики и руководители бизнеса пытаются очертить круг полномочий по контролю за данными, в этой области есть еще одна, не менее влиятельная сторона — специалисты по данным (data scientist), которые работают над созданием алгоритмов обработки данных, превращающих их в рекомендации, продукты и услуги. Учитывая влияние, которое они могут оказывать на социальную среду, крайне важно соблюсти нейтральность алгоритмизации по отношению к любым слоям населения. Чтобы воплотить эту идею в жизнь, развитие индустрии данных нельзя пускать на самотек — она должна наполняться индивидуальностями и талантливыми кадрами.
Основу здоровой индустрии данных должно создать следующее поколение специалистов по данным, состоящее из максимально широкого круга людей разного пола, верований, национальностей и убеждений.
1. Гендерное и этническое многообразие позволяет лучше представлять широкие слои населения. Разумеется, пол или этническая принадлежность не определяют, кто преуспеет в таких высококлассных профессиях, как программист или управляющий хедж-фонда. Однако, например, негры составляют 13% населения США, но в штате ведущих технологических компаний — Google и Amazon не являются исключениями — числится только 1% представителей этой расы. Конечно, технологические фирмы нельзя винить в отсутствии гендерного или национального многообразия. Оно скорее связано с историческим влиянием географической сегрегации этнических групп, которая была присуща эпохе апартеида, некачественному школьному образованию, низкому доходу на душу населения, устоявшимся стереотипам, которые внушают подрастающему поколению настороженное отношение к академическим областям наук.
Однако культура технологий тем и примечательна, что она умеет сметать любые предубеждения и преграды в виде неписанных правил или социальных ожиданий. ИТ-отрасль уже доказала, что умеет быстро двигаться и изменять правила игры путем изобретения новых функций и их своевременного внедрения, поэтому следует рассчитывать на то, что она сумеет наполнить свои ряды представителями как можно большего количества этнических слоев. В идеале соотношение специалистов по данным должно быть примерно пропорционально половым, этническим и другим демографическим показателям населения.
2. Кадровое многообразие способствует улучшению качества продуктов и услуг. Деятельность специалистов по данным находится в тени, но она неизбежно становится неотъемлемой частью нашей повседневной жизни с момента, когда требуется заказать автомобили каршеринговых служб или получить ответ от голосового помощника — во всех этих случаях задействуются определенные алгоритмы обработки данных. Создание общественно полезных продуктов и услуг подразумевает понимание поведенческой парадигмы потребителя, и наилучшим способом для этого является привлечение к процессу разработки людей с различными точками зрения. Нехватка таких людей может привести к созданию ущербных продуктов и отразится на репутации компании.
Приоритет равенства интересов должен стать основой мышления любой организации, поскольку создание качественных продуктов и услуг, которые приносят доход и более высокую отдачу, возможно только при ориентации на широкие круги населения. По мере «социализации» продуктов и услуг будет расти и значение многонациональной составляющей среди специалистов по данным, начиная с кодировщиков и заканчивая менеджерами высшего звена, принимающими решения о внесении в продукт финальных функций.
3. Гендерное и этническое многообразие помогает противостоять «алгоритмическому насилию». Недостаточно прозрачная деятельность специалистов по данным может представлять опасность в виде появления алгоритмического насилия (algorithmic violence). Этот термин обозначает вред, который алгоритмы или автоматизированные системы принятия решений могут нанести людям взамен удовлетворения их потребностей. Практика приема на работу нженеров-строителей и механиков предусматривает обязательное прохождение курса этики и нравственности, который нужен для того, чтобы предупредить моральный урон, который может быть нанесен спроектированными ими конструкциями человеку. Возможно, такие курсы следует пройти и специалистам по данным — это поможет им научиться мыслить критически и прогнозировать вредные последствия, к которым может привести их работа.
Алгоритмическое насилие трудно поддается осмыслению, поэтому лучше рассмотреть его действие на примере. Гийом Часло, бывший сотрудник Google, причастный к разработке механизма объективных автоматических рекомендаций YouTube, рассказал, как этот целевой движок может навредить отдельным категориям людей. Он разработан таким образом, чтобы пользователи задержались на видеоплатформе на максимально возможное время, и поэтому не препятствует отображению недопустимого контента (теории заговора, вирусное видео), который может нанести психический ущерб детям или людям с психическими отклонениями. Видео могут оказывать воздействие как на микроуровне (на отдельных людей), так и на макроуровне (влияние на голоса избирателей и т. п.). Учитывая, что некоторые категории пользователей включают повышенное количество зависимых людей, алгоритмическое насилие может оказывать на них непропорциональное влияние.
Особую опасность алгоритмическому насилию придает его скрытое воздействие — об этом знает только сам пользователь, поэтому так важно, чтобы среди специалистов в области данных находились люди разных национальностей, конфессий, полов, которые бы придерживались различных точек зрения, руководствовались различными идеями и интересами.
«Разномастность» ученых — это барьер на пути нанесения морального ущерба. Взяв на себя обязательство нанимать и взращивать кадровое разнообразие в области науки о данных, индустрия сделает шаг навстречу обществу справедливости, лучшим продуктам и услугам, а также защитит наиболее уязвимые категории населения от вредного воздействия «объективного» ИИ.