Как BuzzFeed использует процессы автоматизации, чтобы гарантировать, что каждая часть контента имеет хорошие шансы достичь своей целевой аудитории.

Как ИИ и автоматизация используются в BuzzFeed для принятия решений о публикации на их многих-многих страницах? На встрече с группой GEN Study Tour в Нью-Йорке Гилад Лотан, вице-президент по науке о данных в BuzzFeed, позвольте нам взглянуть на некоторые из их внутренних информационных панелей, узнать об их процессе AB-тестирования и найти узнайте, как предотвратить автоматическую публикацию рецепта собаки с перцем чили на BuzzFeed Animals.

Данные для принятия решений

BuzzFeed много вложил в то, что они называют распределенными платформами, включая Twitter, Facebook, Snapchat, Instagram, Youtube и Pinterest. У издателя 300 миллионов подписчиков на YouTube, более 100 страниц в Facebook, а BuzzFeed.com имеет 200 миллионов уникальных посетителей в месяц.

Эти различные платформы не только используются для увеличения просмотров контента, но и рассматриваются как места для экспериментов и применения полученных знаний на других платформах.

«Это работает, только если вы действительно собираете данные об аудитории, верно? Итак, мы создали эту современную коллекцию произведений искусства и технологию. Мы действительно инвестировали в технологию внутри компании, которая помогает нам понять каждый фрагмент контента, который мы публикуем где-либо на стороннем сайте: что с ним происходит, как люди взаимодействуют с ним и как [потребление] меняется с течением времени в - различные фрагменты имеющихся данных », - сказал Лотан.

Эти данные затем используются внутри компании для принятия решений и обеспечения того, чтобы каждому фрагменту контента была предоставлена ​​реальная возможность охватить нужную аудиторию.

Люди учатся на информационных панелях

BuzzFeed имеет ряд внутренних информационных панелей, которые используют данные, собранные из их конвейера.

Один из самых простых - El Dashboard. Он позволяет любому в BuzzFeed видеть показатели эффективности контента, размещенного на всех платформах, включая элементы, которые были адаптированы и переизданы. Например, El Dashboard может отслеживать видео, созданное для кулинарной вертикали BuzzFeed Вкусный, а также его модифицированную версию, которая есть в подборке видео на YouTube. Затем зритель может получить доступ и сравнить показатели производительности для обоих. Это помогает команде понять основные компоненты контента: где он продвигался, где был опубликован и какова была реакция аудитории.

Dashbird - это более наглядная и самоуверенная панель инструментов, которая рассчитывает показатель, называемый социальным лифтом. Это соотношение между вирусными просмотрами (просмотры вне сферы продвижения и контроля BuzzFeed) и исходными просмотрами (просмотры из собственной рекламы BuzzFeed на их сайте и в социальных сетях). Dashbird позволяет зрителю видеть, когда контент был опубликован и на каких страницах, помогая им анализировать, что работает и выполняются ли критерии.

«Каждый может получить к нему доступ в компании. Каждый имеет доступ ко всем показателям исполнителей, что, на мой взгляд, очень мощно. Я знаю, что некоторые медиа-компании не хотят, чтобы их писатели знали об этом, но я думаю, что важно понимать, на что реагирует аудитория. И это так глубоко укоренилось в нашей культуре », - сказал Гилад.

Автоматизация, автоматизация, автоматизация

BuzzFeed имеет набор моделей на основе машинного обучения, которые помогают направлять процесс публикации на их многих-многих страницах.

1. Повторное использование, перевод, переработка

«Мы много думаем об адаптации контента на международном уровне: как нам определить контент, который, вероятно, будет хорошо работать, если мы его переведем?», - сказал Лотан.

BuzzFeed собрал множество исторических данных за эти годы. Используя эвристику и логистическую регрессию, построенная ими модель может предсказать тип статьи, которая может хорошо работать на других языках. Например, если бы команда пыталась определить, какой контент адаптировать с англоязычного рынка к португальскому, модель будет обрабатывать данные, включая разбивку производительности по странам, все исторические статьи и все статьи, которые были переведены. с английского на португальский в прошлом, и на основе результатов логистической регрессии будет сгенерирована «оценка остроты». Чем выше оценка горячности, тем больше вероятность того, что статья будет иметь успех.

Затем бот-пейджер уведомляет редакторов о любых рекомендациях. А потом редакторы сами решают, продолжать или нет.

2. Автоматизация выживания сильнейших

AB-тестирование - еще одна практика, требующая некоторой автоматизации в BuzzFeed. Инструмент тестирования AB встроен в их CMS (систему управления контентом), и в любой статье авторы могут выбрать, хотят ли они протестировать любую комбинацию заголовков и изображений. Затем результаты теста отправляются в Slack, где авторы могут видеть, какие заголовки и изображения работают хорошо, а какие нет.

3. Машины учатся на человеческом поведении

Feed Rangers - это внутренняя служба, которая использует машинное обучение для ранжирования и размещения наиболее интересного контента BuzzFeed на своей домашней странице.

Алгоритм multi-arm bandit берет весь новый публикуемый контент и затем пробует его на видных местах в течение определенного периода времени. Он узнает о производительности и о том, как люди взаимодействуют с контентом, включая клики, время, потраченное на статью, показатель завершения и репосты. Основываясь на том, что изучает алгоритм, он адаптирует размещение контента на домашнем канале.

«Он очень динамичный и подкреплен реальной аудиторией», - сказал Лотан.

4. Вдохновение для автоматизированного приготовления пищи

Word2vec использует нейронные сети для понимания словесных ассоциаций. BuzzFeed создал вариант recipe2vec, который используется в кулинарной вертикали BuzzFeed Tasty для добавления связанных рецептов на страницу рецептов.

Recipe2vec - это внутренняя система, которая выводит на поверхность похожие рецепты, изучая векторизованные представления слов в корпусе рецептов. Он не просто объединяет рецепты, в которых используются одни и те же ингредиенты, но и рецепты со схожими методами приготовления или вкусовыми характеристиками.

Например, вместо того, чтобы сгруппировать все блюда из свинины вместе, ссылки на соответствующие рецепты на странице рецептов свиных отбивных с чесноком и травами могут также включать курицу, фаршированную фахитой!

5. Нейронные сети для публикации решений

Внутренний инструмент BuzzFeed Social Mission Control автоматически определяет, на какой странице Facebook следует размещать определенный контент для его продвижения.

«Некоторые из этих страниц действительно огромны, у них миллионы и миллионы подписчиков, поэтому мы используем различные исторические данные для принятия этих решений», - сказал Лотан.

Как работает это автоматическое курирование?

BuzzFeed использует классификатор слов, который объединяет похожие слова. (Классификаторы в нейронной сети группируют вещи вместе по общим характеристикам).

После того, как классификаторы обучены словам по всем темам, охватываемым BuzzFeed, они могут начать определять места на разных страницах, где есть возможность продвигать определенный контент. Затем редактор-человек должен принять или отклонить рекомендацию. Если в BuzzFeed нет никого, кто курировал бы определенную страницу или эта страница менее важна, этот процесс полностью автоматизирован.

Актуальность и повторная публикация

BuzzFeed продолжает добавлять современные технологии в эти издательские системы, чтобы сделать их максимально эффективными. Один из примеров - оптимизация релевантности. Например, на BuzzFeed Animals вы, вероятно, встретите слова собака и очаровательны гораздо чаще, поэтому статьи, содержащие эти слова, могут автоматически сопоставляться с этой страницей. Но как они могут сделать так, чтобы съедобная собачка с чили не оказалась среди всех очаровательных пушистых собак? Нейронные сети обучены понимать не только слова, но и их отношения друг к другу. Слова в рецепте для собак с перцем чили не будут ассоциироваться со словами в статье о животном, что означает, что оценка релевантности будет низкой, а собака с перцем чили будет держаться подальше.

Рекомендации для вечнозеленого контента также автоматизированы, поэтому, если редакторам нужно опубликовать полностью готовый контент прямо сейчас, у них будет быстрый доступ к релевантным статьям.

«Повторное использование и добавление множителей к нашему контенту дает BuzzFeed большое преимущество в участии в этой многоплатформенной экосистеме. Мы увидели многообещающие результаты. Для некоторых первых страниц, где процесс был полностью автоматизирован, мы видели хорошие результаты, если не немного лучше », - сказал Лотан.

«Мы заметили рост количества материалов, публикуемых на этих страницах. Таким образом, мы более эффективно распространяем наш контент среди нужной аудитории. Часто об этом контенте просто забывают, потому что у нас так много материалов публикуется в день. Когда у вас есть много мест, где вы можете опубликовать эти элементы, эти инструменты становятся действительно эффективными в действии ».

«В конце концов, создатели людей по-прежнему имеют полный контроль и могут перезаписывать решения, принимаемые машиной», - сказал Лотан. По его словам, люди, работающие в BuzzFeed, не чувствуют, что машины берут на себя их работу, но инструменты убирают самые скучные части, давая им больше времени для выработки стратегии.

Гилад Лотан - вице-президент по данным в BuzzFeed. Он также является адъюнкт-профессором Нью-Йоркского университета. До этого он работал в компании Betwaworks, в том числе в Microsoft.