НовостиОбзорыСобытияIT@WorkРеклама
Big Data/Аналитика:
Продуктовое мышление требует новых инструментов. Ваш Jira тянет?
Российский рынок разработки продолжает рост, корпоративным заказчикам нужны инструменты для управления процессами, услугами …
Почему выход новой версии ALD Pro — событие для российского рынка ИТ?
Мажорное обновление ALD Pro версии 3.0 — важный этап в развитии отечественных служб каталога. Релиз включает множество …
Лучшие видеоредакторы для новичков и любителей
Начать монтаж видео сегодня довольно просто, т.к. любой видеоредактор работает по понятной логике «импорт — …
Дмитрий Кузьмин: «Архитектура — это поле, где решается будущее конкурентоспособности компании»
Архитектурные решения инженера-разработчика лежат в основе крупнейших коммерческих платформ, государственных сервисов …
«Инструмент, без которого уже не пишут на Go»: интервью с автором golangci-lint Денисом Исаевым
При разработке на Go активно используются линтеры — программы для статического анализа кода. Металинтер golangci-lint …
 

Применение машинного обучения в рекламе: системы фильтрации трафика

Александр Егоров | 20.11.2023

Разработчики и аналитики данных используют машинное обучение и нейросети уже практически во всех сферах информационных технологий. Их применение — это не просто желание угнаться за всеми самыми модными инновациями, а реальная экономия времени, сил и средств при решении определённых задач. Статистические исследования говорят о том, что компании готовы обращаться к ML-инструментам всё чаще: в 2022 году рынок машинного обучения оценивался в 3,8 миллиарда долларов, а к 2032 году он будет оцениваться в 116.8 миллиардов долларов. Наш приглашённый эксперт Ольга Ковалёва, старший аналитик данных в компании «Яндекс», имеет внушительный опыт в Big Data разработке и машинном обучении. Ольга расскажет о том, как работают ML-инструменты фильтрации трафика и о перспективах в сфере рекламного бизнеса.

Ольга Ковалёва

ML-технологии в разработке

Машинное обучение — это алгоритм, который позволяет выявлять закономерности в данных и прогнозировать результаты. «Кажется, что машинное обучение — это чудо, но на самом деле — это просто математическая модель. Не будем преуменьшать значение машинного обучения в нашей жизни: действительно, оно увеличивает эффективность и скорость аналитики и подсчёта статистики. Доля рынка ML-решений на 2023 год составляет 64%, и эксперты прогнозируют, что каждый год она будет прибавлять ещё по 20%». При разработке продуктов можно использовать разные виды машинного обучения:

  • машинное обучение с учителем (заранее размеченные данные, нейросеть обучается на «правильных» ответах);
  • машинное обучение без учителя (нейросеть разделяет необработанные данные по какому-либо признаку).

«Для разных типов продуктов применяется разный тип машинного обучения. Например, нейросеть „с учителем“, подходит для классификации однотипных баз данных с минимальным процентом аномалий. К сожалению, такая нейросеть требует предварительной разметки данных, и чаще всего этим занимается человек (а это — издержки). Конечно, когда-то компания Google предложила пользователям „поиграть“ в разметчиков, но это было в 2006 году. Сейчас компании стремятся минимизировать расходы на сотрудников, поэтому всё чаще они прибегают к нейросети „без учителя“. Этот способ является более трудоёмким, но зато после разработки можно работать с „сырыми“ базами данных. Нейросеть „без учителя“ умеет кластеризировать информацию и находить аномалии».

Применение ML в инструментах размещения рекламы

Машинное обучение нейросетей отлично подходит для работы в сфере рекламы: Big Data, очень много нетипичного контента, разнообразные сферы применения. «Я применяла машинное обучение для обнаружения аномалий в рекламном трафике. Это необходимо для того, чтобы отслеживать некачественные взаимодействия с рекламными объявлениями. По всему миру издержки компаний из-за „плохого“ трафика составляют 66 миллиардов долларов, поэтому разработчики из разных стран ищут решение этой проблемы».

Вызовы в работе с рекламным трафиком

Ольга Ковалёва столкнулась с некоторыми сложностями при внедрении ML-инструментов. «Рекламный бизнес — это всегда огромное количество разнообразной информации: данные в виде текста, аудио, картинок. Неструктурированные данные с аномалиями являются причиной высоких нагрузок на вычислительные мощности любой нейросети. Сервисы, в которые я внедряла ML-инструменты, должны работать непрерывно, поэтому были задействованы специальные bridge-технологии для безопасной поставки кода и тестирования системы».

Автоматические системы модерации

Под автоматическими системами модерации в рекламе подразумеваются несколько технологий. Во-первых, это модерация самих креативов, а во-вторых — фильтрация фрод-трафика. «Если говорить о модерации контента от рекламодателей, то здесь мы обычно наблюдаем проверку в несколько этапов: автоматизированная проверка по ключевым словам, нейросетевые модели и инструменты, проверяющие ссылки. Проверки с использованием искусственного интеллекта и нейросетей сокращают время проверки „вручную“ в 3,5% по данным CVF. Это ещё один аргумент в пользу использования машинного обучения в сфере рекламы». Можно отсеивать некачественный трафик на этапе биддинга. Инструменты, встроенные в платформы для продажи мест под рекламу, обеспечивают прозрачность сделок и поддерживают репутацию площадки, отсеивая потенциально мошенническую рекламу. «В рекламных компаниях, которые специализируются на сопровождении клиентов, такая манипуляция трафиком приводит к отсеиванию 40% предложений, которые не приведут к росту продаж, соответственно их клиенты получают более качественный трафик. Я считаю, что самое главное в таких манипуляциях — это сохранять стабильность самого сервиса».

Система фильтрации в сервисе для подсчёта статистики популярности запросов и ключевых слов

Как узнать самый популярный запрос в интернете? Для этого есть специальные статистические сервисы. На основе полученной информации можно судить о популярности тех или иных явлений, узнать о «болях» потенциальных клиентов и даже составить маркетинговую стратегию.

«К сожалению, с появлением ботов и ботнетов такие сервисы становятся уязвимыми, предоставляют недостоверную информацию. Для любой компании-владельца это недопустимо, поэтому они встраивают специальные системы фильтрации трафика в свои продукты, например такие инструменты есть у Google Trends. Я создала и обучила систему фильтрации для похожего сервиса, и результаты приятно меня удивили: во-первых, получилось сохранить стабильную работу сервиса при обработке миллионов запросов ежедневно, из которых около половины являются искусственными. Во-вторых, на 30% увеличилось качество данных, что снизило всплески активности серверов из-за столкновения с аномалиями, то есть удалось снизить нагрузку на вычислительные мощности».

Качество рекламного трафика

Для оценки маркетинговой стратегии необходимо обладать определённым инструментарием, с помощью которого можно определить, насколько успешной была та или иная рекламная кампания. «В основном качество рекламного трафика оценивается по следующим метрикам:

  • ROI (Return of Inverstment) — возврат на инвестиции;
  • CPC (Cost per Click) — стоимость клика;
  • CPA (Cost per Action) — стоимость действия;
  • CPL (Cost per Lead) — стоимость лида;
  • и др.

Крупнейшие игроки на рынке маркетинга предлагают продукты, где проверка стратегии будет осуществляться автоматически, в режиме реального времени. Автоматизированная проверка позволяет вовремя заметить и исправить ошибки, а также выдаёт аналитические данные, на основе которых сотрудники могут принимать решения». Такая разработка положительно складывается на бюджете и позволяет тратить меньше времени на сверки вручную.

Перспективы применения ML в рекламе

Машинное обучение и нейросети прочно обосновались в рекламном бизнесе, но Ольга Ковалёва считает, что ещё есть возможности для роста. «Одно из направлений для развития машинного обучения в рекламе — это предикативная аналитика, которая позволит более эффективно распределять средства. Следующий тренд — это автоматизация в программатик-рекламе. Мы будем постепенно отказываться от выбора рекламных площадок „вручную“, всю аналитическую работу будет выполнять нейросеть, пользователю останется лишь внести денежные средства».

Другие спецпроекты
ПечатьПечать без изображений

Комментарии

Только зарегистрированные пользователи могут оставлять комментарий.

Регистрация
Авторизация

ПОДГОТОВЛЕНО ITWEEK EXPERT

 
Интересно
Gartner: четыре основных принципа успешного управления мастер-данными
Управление мастер-данными (MDM) обеспечивает достоверные инсайты благодаря особому вниманию к процессам, людям, технологиям …
Инженеры по данным превращаются в реальную движущую силу ИИ
Новый отчет MIT Technology Review Insights, подготовленный в партнерстве с Snowflake, ясно показывает тенденцию …
Наблюдаемость данных: пять шагов к данным, готовым для ИИ
Теперь, когда искусственный интеллект стал темой для обсуждения на уровне советов директоров, организации спешат достичь …
Источник силы ИИ: кто контролирует уровень корпоративных данных?
ИТ-отделам и специалистам по данным обещали, что искусственный интеллект упростит работу. Вместо этого он создал …
Новая Open Source-экономика инфраструктуры данных
Многоуровневое хранение, векторный поиск и аналитика реального времени обеспечивают одновременную оптимизацию …