Как мы можем использовать НЛП в эпоху постправды для борьбы с проверкой фактов и фейковыми новостями?

Одним из учебных пособий на EMNLP 2020 является «Проверка фактов, фейковые новости, пропаганда и предвзятость СМИ: поиск истины в эпоху постправды». Я посетил этот урок, потому что я провел некоторые предыдущие исследования в этой области и нашел его весьма увлекательным. Вот основные моменты, которые я узнал, и я думаю, что вы также найдете их весьма интересными.

Поддельные новости — это проблема. В наше время поддельные новости стали серьезной проблемой по многим причинам. Мало того, что общественность потеряла доверие к традиционным СМИ, у нее также низкий уровень критического мышления и новостной грамотности, что в сочетании со сменой бизнес-моделей злоумышленниками, ищущими финансовую или политическую выгоду, привело к тому, что фейковые новости стали огромным проблема. Фактически, исследования показали, что фальшивые новости распространяются в шесть раз быстрее, чем настоящие новости, и могут распространяться менее чем за десять минут. Таким образом, важно иметь возможность быстро и точно идентифицировать фейковые новости.

Неверность информации. При классификации информации в этих поддельных новостных статьях существует три основных типа с разным уровнем достоверности и злонамеренностью.

  • Дезинформация: непреднамеренные ошибки, которые фактически неверны, но сделаны не по злому умыслу. Примеры включают неправильные подписи к изображениям или серьезное отношение к сатирической статье (как эта из The Onion).
  • Дезинформация: сфабрикованный или сфабрикованный контент, который фактически неверен и создан злонамеренно. Примеры включают измененные графики или неверную статистику.
  • Неверная информация: личная информация (которая может быть или не быть фактически верной), сделанная со злым умыслом. Примеры включают публикацию порно мести или чью-то историю голосования.

Искусственный интеллект для помощи в проверке фактов. Теперь, когда у нас есть общее представление о проблеме фейковых новостей, как нам с ней справиться? Конечно, всегда есть путь ручной проверки фактов, например, когда новостные группы проверяют факты кандидатов в президенты во время дебатов. И полностью противоположным этому является путь автоматической проверки фактов, который полагался бы на искусственный интеллект для автоматической проверки утверждений и анализа новостных статей. Хотя многие считают автоматическую проверку фактов долгосрочной целью, проблема заключается в том, что люди в настоящее время не доверяют машинам в точной проверке фактов и предпочитают, чтобы проверку фактов выполняли люди. Таким образом, промежуточным звеном является использование технологий для помощи людям, проверяющим факты. Есть два основных способа сделать это:

  • Определить достоверность утверждения. Другими словами, используйте машины для анализа важности проверяемого факта, чтобы люди могли уделять больше времени фактической проверке фактов. Но как машины могут судить, что важно, а что нет? Текущие исследования используют четыре вопроса в качестве критерия для проверки достоверности факта:

(1)Содержит ли факт поддающееся проверке фактическое утверждение? Если невозможно проверить факт, то нет смысла пытаться его проверить.

(2) Является ли факт ложным?Если вероятность того, что утверждение ложно, ничтожно мала, то лучше потратить время на проверку фактов, которые с большей вероятностью окажутся ложными. .

(3) Представляет ли этот факт интерес для широкой публики?Очевидно, что мы не должны тратить время на проверку тривиальных утверждений, таких как твит, в котором говорится: «Сегодня я звонил маме».

(4)Может ли этот факт причинить кому-то вред?Если утверждение не опасно, то лучше потратить время на проверку более опасных утверждений.

  • Убедитесь, что факты не перепроверяются. Еще один важный элемент, в котором искусственный интеллект может помочь людям, помогает определить, когда кто-то говорит что-то, что уже было проверено. Таким образом, ИИ может убедиться, что время не будет потрачено впустую на повторную проверку одного и того же утверждения, поскольку вы хотите максимизировать количество различных проверяемых фактов. Это сложная проблема, которую можно решить с помощью методов, начиная от простого косинусного сходства между утверждениями и заканчивая сложными глубокими нейронными сетями для определения сходства и основного намерения/смысла между утверждениями.

Автоматическая проверка фактов. Если, в конце концов, мы решим, что искусственный интеллект с автоматической проверкой фактов приемлем, как мы можем его внедрить? Итак, есть два способа автоматической проверки фактов:

  1. Проверка фактов на основе фактических данных. Очевидный метод — сопоставить утверждение с существующими фактами, чтобы проверить, соответствует ли оно действительности. Это точно и вполне объяснимо, но это также требует значительных затрат. Он не только предполагает, что утверждение поддается проверке (например, что, если мировой лидер решит сказать, что «вся Вселенная была создана в прошлый четверг»), но также требует огромной базы данных доказательств, потому что ИИ нуждается в достаточном количестве доказательств по очень многим различных областях, чтобы иметь возможность проверить приемлемую долю требований.
  2. Контекстное обнаружение фальшивых новостей. Альтернативный метод — использовать контекст утверждения, чтобы попытаться сделать предположение о том, правда это или нет. Например, если заявление было сделано The Onion, мы, вероятно, могли бы предположить, что это неправда. Или, если утверждение было отклонено несколькими крупными СМИ, такими как CNN и Fox News, то его можно считать ложным. Конечно, ИИ мог бы заглянуть гораздо глубже, чтобы максимально повысить точность своей интуиции. Этот метод менее точен и менее объясним, но он устраняет дорогостоящее требование явных доказательств.

Заключительные мысли. Фальшивые новости — это сложная проблема в наше время. Это чрезвычайно важный вопрос, но, возможно, он не получает достаточного внимания со стороны общественности. Однако интересно видеть, как область ИИ в целом и НЛП в частности пытается помочь решить эту проблему. Будем надеяться, что, имея достаточно времени и исследований, мы сможем найти способ быстро и точно идентифицировать фейковые новости, чтобы мы не продолжали страдать от растущих последствий дезинформации.