Первоначально опубликовано на LinkedIn….

Эпоха фейковых новостей

В новую эру, основанную на данных, традиционные СМИ и онлайн-социальные сети распространяют новости очень быстро. Трудно отличить настоящие новости от фейковых. Распространение дезинформации без проверки и фильтрации данных является большой проблемой этой эпохи.

Определение фейковых новостей (нежелательных новостей, псевдоновостей или мистификаций) звучит так: «Это тип новостей, созданных специально для распространения дезинформации или мистификаций через традиционные средства массовой информации (печатные и вещательные) или онлайн-социальные сети».

Распространение дезинформации огромно и оказывает заметное негативное влияние. В 2016 году Оксфордские словари объявили «постправду» словом года с зарегистрированным увеличением на 2000% по сравнению с 2015 годом.

Согласно словарю, слово «постправда» относится к обстоятельствам, когда люди больше реагируют на чувства и эмоции, чем на факты. В связи с этим очень хорошо известна «политика постправды». В этом случае любое количество данных подбирается и формируется по обстоятельствам. Намерение состоит в том, чтобы вывести смысл выбора писателя, который должен создать негатив в обществе.

В Индии 2019 год отмечен как уникальный год распространения дезинформации. Несмотря на меры правительства по борьбе с фейковыми новостями и саморегулирование, реализованное платформами социальных сетей WhatsApp и Facebook, распространение было неконтролируемым. Распространение дезинформации о правительственных выборах, нападении на Пулваму, отмене статьи 370 или акте протеста CAA было огромным. Такого рода инфодемия разрушает коллективный эффект правительства по поддержанию правопорядка в стране.

Фактчекеры говорят, что на 20–50% увеличилось число постов, которые необходимо проверить. Учитывая ситуацию, они планируют нанять больше людей, проводить проверку фактов на большем количестве индийских языков и организовывать больше семинаров по повышению осведомленности.

В нынешней ситуации коронавирус является серьезной проблемой для всего мира. Дезинформация о вирусе, таком как 5G, распространяет пандемию, жаркая погода может контролировать распространение вируса, продавец винограда, у которого положительный результат теста на COVID-19, плюет на виноград, вызывает огромную озабоченность. Такого рода дезинформация создает хаос, и совместные усилия всего мира по контролю за распространением вируса снижаются.

Обилие доступности Интернета и широкое распространение почти сделали распространение фальшивых новостей неконтролируемым. Проблема заключается в начинающих пользователей Интернета. Они не разбираются в источниках новостей и плохо разбираются в дезинформации. Таким образом, очень легко доверять ложным новостям. Контролировать быстрое распространение дезинформации человеческими ресурсами невозможно. Итак, наступает роль искусственного интеллекта и машинного обучения. Его можно использовать для создания алгоритма, который может помочь в проверке данных и фильтрации между реальными и фальшивыми новостями.

Что такое ИИ и МО?

Искусственный интеллект означает, что компьютерные программы могут выполнять задачу с человеческим интеллектом. В случае ИИ компьютерные системы могут обучаться и выполнять задачу самостоятельно, без кодирования. Таким образом, вы можете назвать их умными компьютерами.

Тогда что такое машинное обучение? Машинное обучение — это применение искусственного интеллекта, при котором машины учатся на собственном опыте и выполняют задачу без программирования.

AI и ML больше не мифы. Каждая компания пытается использовать AI и ML для улучшения своих технологий. Не только это, мы также сталкиваемся с ИИ и машинным обучением вокруг нас в повседневной жизни в виде прогнозов Google на основе ИИ (Карты Google), приложений для совместных поездок (Uber/Meru), коммерческих рейсов с использованием автопилота ИИ и виртуального помощника ИИ ( Алекса) и др.

С ростом использования AI и ML больше всего выигрывают области проверки фактов и фильтрации контента. AI и ML оказывают глубокое влияние на эти области и, следовательно, это лучший способ контролировать распространение фейковых новостей.

Как AI и ML могут обнаруживать фейковые новости?

Под широкими крыльями AI & ML есть много инструментов, которые можно использовать для создания алгоритма для детекторов фейковых новостей. Одним из них является НЛП (обработка естественного языка). Чтобы обнаруживать фейковые новости, исследователи предложили детектор фейковых новостей, который будет использовать НЛП для анализа соотношения слов и статей. Характеристики этих детекторов впечатляют, но в них также есть много лазеек.

Первая лазейка заключается в том, что статья, написанная не в соответствии с профессиональными стандартами письма, будет определяться как фейковые новости. Это означает, что он будет определять только подписанные статьи или статьи, заголовок которых не соответствует содержанию (кликбейт), или статьи, которые являются предвзятыми или вызывают бурные эмоции, как фейковые новости.

Таким образом, такого рода детекторы могут отфильтровать большое количество фейковых новостей, но проблема в том, что многие настоящие новости, которые подписаны или имеют правдивое, но подстрекательское содержание, также могут быть помечены как фейковые новости.

Платформы социальных сетей, такие как Twitter в США и TouTiao в Китае, содержат большое количество новостного контента, предоставляемого пользователями. Если контент предоставлен пользователем, существует огромная вероятность того, что он не будет соответствовать стандарту, соответствующему профессиональному контенту, или может содержать правдивый, но подстрекательский контент.

Вторая лазейка — это закалка хорошо написанных реальных статей. Например, профессиональные написанные настоящие статьи можно смягчить, изменив тему или сохранив заголовки тесно связанными с содержанием и просто изменив факт без использования предвзятых фраз. В этой ситуации статья может легко ускользнуть от обнаружения.

Вывод

Основой AI & ML является набор данных, основанный на знаниях. Обнаружение фейковых новостей не так просто, как кажется, поскольку AI и ML не обладают человеческими способностями к суждениям, инстинктам и другим подобным субъективным качествам.

Для обнаружения поддельных новостей знания, основанные на фактах, также важны наряду с моделями, основанными на НЛП (обработке естественного языка). Принимая во внимание все области исследований, многие инструменты используются для разработки алгоритма обнаружения фейковых новостей, и в этом есть значительный прогресс. Al & ML — это глубокая тема для исследований, и многообещающие результаты видны в обнаружении фальшивых новостей.