Индустрия, в которой крутятся колоссальные деньги, опирается на миллионы людей, которые зачастую едва сводят концы с концами, пишет колумнист Bloomberg News Парми Олсон.
Возможно, вы слышали, что революционный искусственный интеллект стоит на старом фундаменте. В цепочке поставок, создающей инструменты генеративного ИИ, такие как ChatGPT, есть высокооплачиваемые руководители и исследователи на самом верху, а в самом низу — работяги, которые трудятся за экранами, обучая алгоритмы. По последним оценкам Всемирного банка, такой работой занимаются от 150 до 430 млн. человек: они аннотируют изображения, тексты и аудиозаписи, создают ограничительные рамки вокруг объектов на изображениях, а в последнее время пишут хайку, эссе и вымышленные истории для обучения сложных инструментов, которые со временем могут заменить таких людей, как я.
Они также находятся в своеобразном экономическом болоте. «Я никогда не встречала работника, который сказал бы мне: „Эта работа дала мне возможность купить дом или отправить детей в университет“», — говорит Милагрос Мицели, исследователь из Distributed AI Research Institute и Института Вейценбаума, которая работала с десятками работников сферы данных по всему миру.
Она вспоминает, как в 2019 г. в аргентинских трущобах беседовала примерно с дюжиной работников по маркировке данных, зарабатывающих около 1,7 долл. в час. Когда она снова встретилась с ними в
Таким работникам часто приходится устраиваться на вторую работу или брать ночные смены, говорит Мадхумита Мурджиа, редактор по ИИ газеты Financial Times, чья недавняя книга «Code Dependent» содержит их истории из разных уголков развивающегося мира. Например, одна женщина, работавшая в компании Samasource Impact Sourcing в Найроби, не смогла содержать себя и свою дочь на свою зарплату и была вынуждена переехать к родителям.
Эта работа сама по себе нестабильна. Одна работница в Болгарии не смогла заплатить за квартиру, потому что ее отстранили от выполнения оплачиваемых заданий после того, как она пожаловалась на ночные смены. «Здесь ты находишься в одном шаге от того, что все развалится», — говорит Мурджиа. При этом конечными заказчиками являются такие компании, как Microsoft и OpenAI, одни из самых дорогих в мире. «Они как работницы фабрики на Филиппинах, которые не понимают, что платья, которые они шьют, будут стоить 3000 долл.».
В этой сфере также очень мало того, к чему так стремится развивающийся мир: восходящей мобильности. Мурджиа обнаружила, что работники сферы данных не переходят на более высоко оплачиваемую цифровую работу. «Они продолжают заниматься низкооплачиваемой работой», — говорит она.
Руководители фирм, занимающихся маркировкой данных, часто начинают свою деятельность с благородными намерениями помочь людям вырваться из нищеты, но им с трудом удается заставить корпоративных клиентов платить больше, поскольку конкуренция в их сфере растет. По данным исследования, проведенного в 2021 г. Оксфордским институтом Интернета, большинство платформ для работы с данными не имеют политики, гарантирующей, что их работники на местах будут получать хотя бы минимальную зарплату.
Возьмем, например, объявление о поиске «профессиональных переводчиков» на нигерийский язык игбо, предлагающее до 17 долл. в час за помощь в обучении моделей генеративного ИИ. Это намного ниже средней ставки для нигерийских переводчиков, которые, как правило, начинаются с 25 долл. в час. Объявление разместила Remotasks, основная платформа базирующегося в Сан-Франциско ИИ-стартапа Scale.ai, который только что привлек 1 млрд. долл. от инвесторов, включая Amazon.com, в одном из крупнейших раундов финансирования в этом году.
Эта компания и такие конкуренты, как базирующаяся в Сан-Франциско Samasource Impact Sourcing, аргентинская Arbusta и болгарская Humans in the Loop, играют важную роль в цепочке поставок ИИ, но уже много лет обычно платят работникам лишь столько, чтобы хватало на жизнь, говорят Мурджиа и Мицели.
Так вполне может продолжаться и дальше, даже если работа с данными будет становиться все сложнее. В последнее время такие платформы, как Scale.ai, ищут более квалифицированных работников, в том числе художников и людей с творческим образованием, которые пишут короткие истории для обучения систем ИИ, говорится в документах с инструкциями, с которыми ознакомилась Мицели. Несмотря на то, что зарплата таких работников выше, она все равно ниже той, которую должны получать люди с учеными степенями.
Исследователи говорят, что спрос на такую работу растет, но в условиях отсутствия стимулов для обеспечения справедливой оплаты труда трудно ожидать улучшения экономического положения работников. Обучение ИИ уже обходится ужасающе дорого из-за стоимости чипов и облачных вычислений. (Венчурная компания Sequoia Capital недавно подсчитала, что в 2023 г. индустрия ИИ потратила 50 млрд. долл. на чипы Nvidia для обучения ИИ, но получила лишь около 3 млрд. долл. дохода.)
Это означает сокращение возможностей для людей, стоящих у истоков ИИ-революции, и еще раз показывает, что истинный преобразующий эффект технологии заключается в укреплении экономической мощи.
Возможно, нам стоит поучиться у Nike. В
Проблема работников сферы данных заключается в том, что их работу сложнее представить в том же конкретном виде, в каком вы представляете себе мальчика, шьющего теннисные туфли на тускло освещенном складе, и это может затруднить их защиту. Но технологическим компаниям следует помнить, что плохие условия труда в нижнем звене цепочки поставок могут также привести к появлению некачественного ИИ. Это особенно проблематично, поскольку общественность сегодня как никогда настороженно относится к хайповым моделям с галлюцинациями. Ответ на этот вопрос прост: платите работникам, занимающимся обработкой данных, больше и относитесь к ним лучше.