Болезненность, жар и Евразия ТВ

Пандемия Covid-19 и вакцинация в глобальном масштабе

Пандемия Covid-19 почти полностью изменила нашу жизнь. Мы начали носить маски на публике, работать дома с семьей, а не с коллегами, и использовать дезинфицирующее средство для рук гораздо чаще, чем до пандемии.

По мере того, как все больше стран начинают внедрять вакцины против Covid-19, мы начинаем видеть, как люди делятся своим опытом или побочными эффектами после вакцинации в Интернете.

В этой статье мы будем использовать обработку естественного языка (NLP) для анализа реакции людей на вакцину Covid с помощью твитов с #vaccineSideEffect.

О твитах

Набор данных, который мы используем, содержит около 480 твитов с хэштегом «#vaccineSideEffect», что составляет около 9,6 тыс. Слов. А после удаления URL-адресов и распространенных стоп-слов, таких как «the», «a», «for», у нас осталось около 1,9 тыс. Слов для анализа.

Наиболее употребительные слова о побочных эффектах вакцины

В этом разделе мы рассмотрим наиболее часто используемые термины в Твиттере в виде биграмм (двух слов), существительного и глагола.

Токены из двух слов часто дают нам лучший контекст для набора данных по сравнению с токенами из одного слова. Анализ существительных может рассказать нам о людях, вещах и т. Д., Которые обсуждаются в Твиттере, а анализ Verb может рассказать нам, что люди думают о побочном эффекте вакцины Covid.

Облако слов частоты 2 слова

Во-первых, давайте посмотрим на наиболее часто используемые токены из двух слов в твитах.

Облако слов в крайнем левом углу показывает нам термины, используемые как минимум 15 раз в извлеченных твитах. А в тройку наиболее часто используемых терминов входят «covid 19» (100 раз), «19 паспорт» и «Евразия тв» (по 93 раза).

Слово «профессор» также появлялось несколько раз, имея в виду «заслуженный проф», «немецкий профессор», «профессор сучарид», «бхакди проф» в облаке слов.

Облако слов частоты существительных

Затем давайте посмотрим на существительные, которые упоминались в Твиттере более 29 раз и рассказывали о побочных эффектах вакцины. После исключения слова «эффект» существительные, которые используются более 90 раз, - это «видео», «телевидение», «Евразия», «паспорт» и «тропы».

Как и в нашем биграммном анализе, слова «микробиология» и «иммунология» являются одними из наиболее часто используемых существительных в отношении побочного эффекта вакцины.

Облако слов частоты глагола

Облако слов частоты глаголов в крайнем правом углу говорит нам о глаголах, которые использовались в Твиттере более 5 раз. В этом случае извлечение глаголов могло только сказать нам, что люди думают о побочных эффектах вакцины.

Чаще всего используется глагол «проверить» (99 раз), за которым следует «вакцинировать» (24 раза). 4 глагола находятся в 10-кратном диапазоне - «умереть», «почувствовать», «прочитать» и «взять».

Настроения вокруг вакцины Covid

В этом разделе мы будем использовать методы анализа настроений, чтобы понять настроения, связанные с вакциной Covid.

Мы будем использовать лексику «bing», чтобы разделить слова в твитах на положительные и отрицательные, чтобы найти самые положительные слова.

Основываясь на приведенных выше столбчатых диаграммах положительности, мы могли сгруппировать слова в две категории: восприятие людьми вакцины Covid и симптомы после вакцинации Covid.

Восприятие вакцины Covid

Такие слова, как «неблагоприятный», «риск», «опасный», «умереть» могут указывать на то, что люди по-прежнему с осторожностью относятся к введению вакцины Covid. С другой стороны, мы также видим, что люди выражают свое доверие к вакцинам, используя такие слова, как «доверие», «безопасность» и «одобрение». Слово «счастливчик» также может означать, что люди хотят получить вакцину против Covid.

Симптомы после вакцинации против Covid

Мы можем интерпретировать такие слова, как «боль», «плохо», «лихорадка», «болит», как побочные эффекты вакцинации против Covid. Но на гистограмме положительных слов мы также видим такие слова, как «хорошо» и «здоровый», когда некоторые люди чувствуют себя хорошо после вакцинации.

Обнаружение эмоций в твитах

Помимо классификации твитов на положительные и отрицательные слова, мы также можем разделить слова на категории эмоций, такие как «гнев», «радость», «удивление» и т. Д.

В этом случае мы будем использовать лексику «NRC», чтобы разделить слова на 8 категорий эмоций. Мы также должны быть внимательны при интерпретации результатов, поскольку некоторые категоризации могут не подходить в нашем контексте.

Например, слово «выстрел» под меткой гнева может относиться к «выстрелу». Однако в нашем анализе «выстрел» относится к вакцине Covid.

Согласно классификационной таблице, большинство ключевых слов с побочными эффектами помечены метками отрицательных эмоций - гнев, страх и печаль.

Есть также несколько должностей, перечисленных под лейблом доверия - профессор, президент и врач. Мы можем предположить, что это авторитетные цифры, на которые люди обращают внимание при вакцинации против Covid.

Некоторые слова встречаются в нескольких ярлыках эмоций, таких как «смерть», «болезнь», «выстрел». Мы можем интерпретировать эти слова как слова с высокими эмоциями, которые оказывают большее влияние на чувства людей.

Понимание побочного эффекта вакцины против Covid с помощью машинного обучения

В этом последнем разделе мы будем использовать технику машинного обучения - тематическое моделирование, чтобы сгруппировать слова по разным темам. Тематическое моделирование может помочь нам понять основной текст без указания каких-либо ключевых слов.

При использовании техники тематического моделирования нам нужно сначала установить количество тем, по которым будут разбиты слова. В этом случае мы будем использовать 3 темы для группировки твитов.

Одна из интересных особенностей тематического моделирования заключается в том, что аналитик должен субъективно интерпретировать результат. Глядя на слова в каждой теме, мы можем предположить, что каждая первая и третья темы имеют четкую тему.

Что касается второй темы, то слова кажутся относительно обычными. Следовательно, нет четкого указания на обсуждаемую тему.

Первая тема - слухи о вакцине Covid, которая притягивает наши руки

Первая тема касается слухов о том, что вакцина Covid делает людей магнитом, которые были опровергнуты Центрами по контролю и профилактике заболеваний (CDC). CDC также является одним из ключевых слов в первой теме.

Третья тема - испытания вакцины против COVID для детей

Третья тема состоит из таких слов, как «испытания», «вопросы» и «дети», которые мы можем интерпретировать как испытания вакцины Covid для детей. Такие слова, как «вопросы», «подождите» и «шутка» могут означать, что люди по-прежнему опасаются вводить вакцину Covid детям.

Вывод

В этой статье мы проанализировали твиты с #vaccineSideEffects с помощью нескольких техник НЛП - частоты слов, анализа тональности и машинного обучения (в частности, тематического моделирования).

Мы можем интерпретировать результат анализа так:

  • Паспорт вакцины против Covid - одна из самых обсуждаемых тем, когда дело доходит до вакцинации.
  • Видео и телепрограммы могут быть основным средством понимания вакцины Covid.
  • Когда дело доходит до вакцины против Covid, люди обращаются за ответами к докторам и профессорам, особенно в области микробиологии и иммунологии.
  • Побочные эффекты вакцины, упомянутые в твитах, - это потенциально болезненность, жар, боль и инфекции.
  • Смерть, болезнь и удача - вот некоторые из эмоциональных словечек, используемых в Твиттере в отношении вакцины Covid.
  • Слухи о вакцинах, вызывающих намагничивание людей, и об испытаниях вакцины от COVID для детей - одни из популярных тем, обсуждаемых в Твиттере.