Понимание эмоционального тона текста с помощью ИИ — Анализ настроений в твитах Monkeypox

Анализ настроений широко используется с начала 20 века, и область его исследований все еще быстро растет. Одним из самых передовых решений является использование ИИ для проведения анализа настроений. Алгоритм использует метод обработки естественного языка (NLP), который позволяет ему определять настроение или эмоции фрагмента текста. В этом случае компании могут реагировать на отзывы пользователей.

Когда мы используем этот алгоритм для анализа корпуса, ему будет присвоена оценка тональности. Оценка тональности — это индикатор от -1 до 1, который показывает, выражает ли содержимое корпуса положительное (1), нейтральное (0) или отрицательное настроение (-1).

Тональность оценивается в диапазоне от 0,2 до 1, и текст все больше склоняется к позитивному настроению.
Оценки тональности в диапазоне от -0,2 до -1, текст, как правило, считается негативным или очень негативным.
Оценка тональности в диапазоне от -0,2 до 0,2, текст считается нейтральным.

Компании, которые извлекают оценки настроений клиентов, могут использовать его в качестве одного из своих ключевых показателей эффективности, поскольку он может показать, как их клиенты относятся к их бренду.

Под рукой!

Веб-скраппинг

Отказ от ответственности: эта статья предназначена только для образовательных целей. Мы не призываем никого парсить веб-сайты, особенно те веб-ресурсы, которые могут иметь положения и условия, запрещающие такие действия.

Как упоминалось ранее, за последние 12 месяцев мы собираемся извлечь из Твиттера около 13,5 тыс. твитов о вирусе Monkeypox. Основная библиотека Python, которую мы используем на этом этапе, называется snscrape.

Как видите, мы успешно собрали 13540 твитов в качестве примера корпуса, которые временно сохранены в DataFrame. В этом DataFrame есть 4 столбца: «Дата и время», «Идентификатор твита», «Текст» и «Имя пользователя».

Расчет тональности и очистка данных

После подготовки наших данных мы теперь можем использовать библиотеку под названием TextBlob для расчета оценки тональности для каждого твита.

Каждому твиту присваивается оценка настроения, которая отображается в новом столбце под названием «Настроение». Перед дальнейшим анализом мы обнаружили, что есть много нейтральных твитов (оценка настроений от -0,2 до 0,2). Нейтральный означает, что нет влияния на мнение или посторонних комментариев. В этом случае мы хотим сосредоточиться только на твитах, которые показывают положительные и отрицательные эмоции, скрывая нейтральные твиты.

Визуализация

Далее мы собираемся рассчитать и визуализировать средний показатель настроений, сгруппированный по месяцам, чтобы увидеть тенденцию того, как общественность время от времени относится к вирусу обезьяньей оспы. Библиотека Python для визуализации среднемесячной оценки настроений — plotly.express.

Это средние оценки настроений за каждый месяц. Далее мы собираемся визуализировать линейный график, используя приведенные выше данные.

На приведенном выше линейном графике показаны оценки настроений с конца августа 2021 года по конец августа 2022 года. Два наиболее резких снижения произошли в период с ноября 2021 года по февраль 2022 года и с мая 2022 года по август 2022 года. Две самые низкие точки на этом графике — февраль 2021 года и август 2022 года. что может быть связано с важными заявлениями государственных департаментов здравоохранения. В целом общественность отрицательно относилась к вирусу обезьяньей оспы за последние 12 месяцев.

В конце концов, мы используем WordCloud, чтобы отобразить ключевые слова, которые чаще всего упоминаются в нашем корпусе, на основе подсчета частоты. Чем крупнее слова появляются в словесном облаке, тем чаще оно упоминается публикой.

Заключение

Как видите, использование ИИ для реализации анализа настроений очень продуктивно для компаний и организаций, которым необходимо просматривать отзывы своих клиентов или общественности, особенно когда набор данных большой. Используя этот алгоритм, мы можем легко отслеживать общественные эмоции по поводу этой последней распространяющейся инфекционной болезни. Это будет очень полезно для соответствующих отделов, чтобы решить, какие действия предпринять, чтобы устранить беспокойство общественности в будущем.