Оригинальные способы, с помощью которых технологические компании заставляют пользователей маркировать свои данные

Этот пост является частью серии, посвященной методам аннотирования высококачественных данных с помощью добровольных усилий пользователя. Ознакомьтесь со ссылками на введение и другие методы в нижней части этой статьи.

С учетом сказанного, приятного чтения.

4. Зрители

Это относится к динамике пользователей, потребляющих контент, просто нажимая кнопку воспроизведения и наблюдая за тем, что отображается. Будь то шоу, на которое они действительно обращают внимание, учебник, в котором они продолжают нажимать кнопку «назад на 10 секунд», чтобы понять новую концепцию, или музыка, которую они используют, чтобы заполнить фон, делая что-то еще. Поставщики услуг внимательно следят за тем, как пользователи ведут себя до, во время и после воспроизведения.

Тип данных: поведенческие данные

Тип маркировки.Объем внимания пользователей измеряется временем, которое они проводят в определенных разделах приложения или окна браузера, количеством просмотров чего-либо, порядком просмотра, и т. д.

Примеры:ПросмотрыиВремя просмотрана YouTube, Netflix, Musical.ly, TikTok, Amazon Video, Vimeo и т. д.

Объяснение

Основываясь на наших привычках просмотра, YouTube может легко навешивать ярлыки на нас как на пользователей: «мамы-сиди дома», «подростки увлекаются видеоиграми», «помешанные на продуктивности мотивирующие материалы», «слушатели тяжелого рока», «фанаты Симпсонов», «любители комедии», «Отаку» и так далее. Конечно, один пользователь может принадлежать к нескольким группам, и именно здесь происходит волшебство; когда мы смотрим новые видео за пределами нашего «прогнозируемого» спектра зрителей, мы обогащаем поведенческие данные о себе более сложными сведениями о том, как работает наш мозг и в чем заключаются наши мотивы. Наш выход за пределы прогнозируемой аудитории происходит частично из-за предложений, которым мы подвергаемся, а частично из-за органического поиска, который мы делаем, за которым следует наша реальная, измеримая аудитория.

Когда дело доходит до измерения количества просмотров, время просмотра является главным доказательством, потому что оно представляет собой наши фактические инвестиции в контент, на котором мы оставляем отметку «просмотрено», в отличие от контента, который мы легко добавляем, чтобы «посмотреть позже». и никогда не вернуться, чтобы посмотреть. Вот почему я бы сказал, что посредством нашего просмотра мы предоставляем неопровержимое доказательство интересующего нас контента, поэтому маркируем его печатью качества и желанности для кого-то в нашем пользовательское ведро.

Еще один отличный пример доказательства просмотров, свидетельствующего о высоком качестве контента, — «Вы все еще смотрите это видео?» приглашение от Netflix. Подумайте об этом, имея доступ к этому ответу, телеканалы с радостью убили бы. Каждый раз, когда шоу, которое вы смотрите на Netflix, заканчивается, включается автоматическое воспроизведение, чтобы начать следующий эпизод или какой-либо рекомендуемый контент. После окончания самого нового видео, если вы не касались пульта в течение всего времени, появится подтверждение, чтобы проверить, смотрите ли вы все еще или нет. Это служит мерой безопасности для предотвращения бесконечного воспроизведения контента по ошибке, когда никто не смотрит, повышая качество собираемой статистики времени воспроизведения. Но это также имеет дополнительное значение, подразумеваемое пользователем, нажимающим кнопку «да», когда его спрашивают. Подумай об этом; если после двух или трех видео, воспроизведенных подряд, вы быстро нажимаете кнопку «да» при появлении запроса, это означает, что вы действительно были вовлечены в этот контент. Таким образом, было бы безопасно дать этому показу наивысшую оценку релевантности.

Чего можно добиться с помощью этих размеченных данных?

Помните, что основной интерес интернет-компаний состоит в том, чтобы удерживать нас за счет безупречной обработки контента, с которым они нас связывают. Понятно, что они одержимы созданием полностью автономных, сверхвысококачественных механизмов предложений, которые могут масштабироваться без участия человека. Таким образом, наборы данных, содержащие время просмотра каждого фрагмента контента пользователями в определенных сегментах, по определению являются тем, что мы можем назвать высококачественной, органически курируемой базой данных контента.

Давайте посмотрим на пример этой концепции в действии. В списке «Впереди», расположенном в пиктограмме на YouTube и других потоковых платформах, часть контента отображается на основе видео, которое вы сейчас смотрите, а часть — на основе вашего индивидуального профиля. Посмотрите, как он отличается в зависимости от более доступной информации YouTube о пользователе в зависимости от продолжительности истории просмотра. Ниже приведено упражнение, в котором 4 разных аккаунта YouTube смотрят одно и то же видео «Hips Don’t Lie» Шакиры. Взгляните на различный контент, который рекомендуется «Далее» в зависимости от того, как долго история просмотров имеет учетная запись.

Поскольку мы можем предположить, что YouTube настроен на максимальное вовлечение пользователей, можно с уверенностью сказать, что рекомендации, основанные на истории просмотров, а не на текущем сходстве видео, гораздо эффективнее.

Введение | 1. Схемы подключения P2P | 2. Системы голосования | 3. Категоризация контента | 4. Зрители | 5. Отслеживание результатов поиска | 6. Автозаполнение| 7. Прямой вопрос | 8. Исправление человеческих ошибок | 9. Инструменты маркировки данных

Сразу после👏 дождя подписывайтесь на нас в Medium, LinkedIn и Twitter.