В интервью под названием Интернет — это живой орган с Алоисом Пумхёзелем из derStandard.at, техническим директором NTENT, д-р Рикардо Баеза-Йейтс рассказал об искаженной реальности в Интернете в наших социальных сетях, новостных порталах и поисковых системах, адаптированных к наши индивидуальные предпочтения. Здесь он показывает нам выход из мира фейковых новостей и пузырей фильтров.

СТАНДАРТ: никто не объективен. У всех есть предубеждения и предубеждения. Говорят, что сеть усиливает такого рода «предвзятость». Каким путем?

Баеза-Йейтс. Существуют разные типы предубеждений. Многие люди беспокоятся о фейковых новостях, но это самый простой случай предвзятости в Интернете, который также сравнительно легко идентифицировать. Ложный контент — это только верхушка айсберга. Многие существующие виды предубеждений неизвестны большинству людей, вот что меня беспокоит. Предвзятость может быть связана с типом презентации и тем, как мы взаимодействуем с контентом. Это также может быть уже закодировано в алгоритмах.

СТАНДАРТ: Каковы примеры этих типов предвзятости?

Баеза-Йейтс: одна из самых больших проблем — предвзятость из-за презентации. Например, хлеб, который вы выбираете для покупки в супермаркете, ограничен ассортиментом хлеба, доступного в вашем супермаркете. Потребители никогда не имеют в наличии все существующие варианты любого продукта. Это также относится и к Сети. Служба онлайн-трансляции может показать мне очень ограниченный выбор. Многие видео не представлены — не потому, что они плохие, а потому, что о них мало информации. Если видео посмотрели всего несколько человек, трудно определить, хорошее ли оно. Точно так же, как и в жизни, где богатые, кажется, становятся еще богаче, в Сети популярные видео становятся все более и более популярными.

СТАНДАРТНЫЙ: Вы говорите о пузырьках фильтров?

Baeza-Yates: Предвзятость через презентацию означает, что система не может узнать все, не может показать все. Пузырьки фильтров являются следствием персонализации. Они показывают пользователям то, что им нравится больше всего. Но они не могут показать ничего нового; ничего, что вам может нравиться, но вы никогда не видели. Спрашивается: как можно найти что-то новое только на основе собственных знаний о мире?

СТАНДАРТНЫЙ. Каковы стратегии, чтобы сломать пузыри фильтров в Интернете?

Баеза-Йейтс: существует как минимум три подхода; наиболее очевидным является увеличение разнообразия. В этом случае система знает, что определенному пользователю нравится A, но также показывает B, C и D. Второй подход, именуемый по-английски «serendipity», допускает случайные открытия, когда реферальный алгоритм ищет что-то, что может быть связаны с предпочтениями пользователя. Третий и самый экстремальный подход — показать что-то противоположное вашим собственным предпочтениям. Даже если пользователю это не нравится, он или она может захотеть знать, что оно есть.

СТАНДАРТ. Социальные сети также хотят быть более персонализированными в будущем и предоставлять весовые коэффициенты в соответствии с индивидуальными предпочтениями. Как предотвратить образование пузырьков на фильтре?

Баеза-Йейтс. Один из способов — предоставить пользователю соответствующий выбор. Вы можете добавить кнопки, которые изменят ваш опыт, например, «Покажи мне больше разнообразия», «Удиви меня» или «Покажи мне темную сторону!» Таким образом, люди могут расширить свой кругозор.

СТАНДАРТ:Вы сказали, что предвзятость не только в содержании, но и в алгоритмах?

Baeza-Yates: Здесь проблема более тонкая. Алгоритмы используют данные для достижения решения. Если данные содержат предвзятость, то и решение тоже. Но алгоритмы могут еще больше усилить предвзятость. Например, в базах данных фотографий система машинного обучения может помочь пользователю пометить изображения. Он предполагает, что можно увидеть собаку, домашнее животное или щенка. Пользователям понравится эта функция, но это также проблема. Через некоторое время все ключевые слова будут предложены алгоритмом, а не людьми. Однако единственный способ, которым система может учиться, — это новый контент, который исходит от людей. Гораздо лучше оставить тегирование людям и использовать такую ​​систему в качестве основы для алгоритма поиска.

СТАНДАРТ:Есть ли у вас другие примеры систематической ошибки в алгоритмах?

Баеза-Йейтс. Большая часть людей, использующих поисковую систему, нажимает на первый результат, даже если третий результат может быть лучше. Алгоритм определяет позицию и связанное с ней смещение ранжирования. Это похоже на то, когда вы получаете один результат продукта в интернет-магазине, но вам нужно прокрутить вниз, чтобы найти другой. Существует также потенциал для социальной предвзятости. Допустим, у одного товара больше положительных отзывов, но другой товар стоит дешевле. Я выбираю на основе этих отзывов, хотя они могут быть основаны на поддельных рекомендациях.

СТАНДАРТНЫЙ. Как поисковые системы могут оценивать качество найденного контента?

Баеза-Йейтс: Это сложная проблема. Многие атрибуты взвешиваются, чтобы отфильтровать лучшие результаты. Но самым важным вкладом является человек. Система считает, что когда много людей на что-то нажимают, это должен быть лучший результат. Эту проблему необходимо учитывать. Итак, у вас есть встроенные поисковые системы, выполняющие нечто, называемое устранением предвзятости. Если щелкнуть новый результат поиска, даже если он расположен дальше назад, он будет иметь другой вес, чем предыдущий популярный результат.

СТАНДАРТ. Как предотвратить быстрое распространение ложных сообщений?

Баеза-Йейтс: ложная информация распространяется разными способами. Часто ложный контент из Интернета воспроизводится, например, в блогах, которые используются для исследований других. Десять лет назад мы показали, что треть веб-контента состоит из двух других третей. Сегодня, возможно, до половины. Интернет — это живой орган, который воспроизводит сам себя и, таким образом, производит ложный или искаженный контент. Единственные, кто может это контролировать, — это люди. Согласно этому принципу, люди должны знать лучше, чем доверять ложному контенту. Однако этому противоречат многие демократические выборы, а также множество других примеров, когда большинство не всегда было право.

СТАНДАРТ. Многие винят Интернет-форумы и каналы социальных сетей, которые делают возможным распространение. Вы согласны?

Баеза-Йейтс: Да, есть жалобы и даже судебные дела. Но я не должен подавать в суд на телефонную компанию, если кто-то оскорбляет меня по телефону. Люди понимают телефон как средство связи, но не для Интернета. Сеть — лучшее средство коммуникации, которое мы создали, не вините в этом мессенджер!

О докторе Рикардо Баеза-Йейтсе: В качестве технического директора доктор Рикардо Баеза-Йейтс курирует техническое видение компании. До NTENT он провел 10 лет в Yahoo! в конечном итоге дорос до вице-президента и главного научного сотрудника. Он также работал профессором в Чилийском университете с 1985 года, где он основал и действовал в качестве директора Центра веб-исследований и дважды занимал должность заведующего кафедрой компьютерных наук; а также профессор Университета Помпеу Фабра в Барселоне с 2005 года, где он основал и работал директором группы веб-исследований. Рикардо является членом ACM и IEEE, имеет более 500 публикаций, десятки тысяч упоминаний, многочисленные награды и несколько патентов. Он является соавтором нескольких книг, в том числе «Современный поиск информации», наиболее широко используемого учебника по поиску.

Он получил степень бакалавра и магистра в области компьютерных наук и электротехники в Университете Чили и степень доктора философии. в области компьютерных наук Университета Ватерлоо.

Свяжитесь с нами в LinkedIn, чтобы узнать больше о новостях в области технологий, мобильных устройств, поиска, рекламы и искусственного интеллекта.

Первоначально опубликовано на www.ntent.com.