Почему Twitter такой удивительный набор данных для сентиментального анализа?

Социальные сети являются очень популярными средствами массовой информации, где люди могут выражать свое мнение. На этих платформах можно найти мнения людей со всего мира, от политики до продуктов повседневного использования.

Одной из таких социальных сетей является Twitter. Twitter отличается от своих современников двумя уникальными особенностями.
1. Политика 140 символов: Твиттер ограничивает количество символов, которые пользователь может использовать в твите. Эта политика заставляет пользователя кратко выражать взгляды/мнения, в результате чего твиты становятся чрезвычайно краткими и по существу.
2. Хэштеги: Твиттер был пионером хэштегов, которые представляют собой не что иное, как строку символов, которая группирует твиты, принадлежащие к одной теме. Забавный факт. Слово "хэштег" на самом деле является каламбуром. Хэштеги используются для группировки данных по общей теме, а хеширование — это метод, который сопоставляет данные с общими функциями в одни и те же слоты. Оглядываясь назад, кажется, что этот каламбур мог быть причиной того, что создатели хэштега выбрали символ решетки (#) вместо любого другого ($ или ^).

Когда кто-то смотрит на твиттер с точки зрения пользователя, он кажется платформой для выражения/чтения мнений других. Но если посмотреть на это с точки зрения аналитика данных, это хранилище огромного количества данных. Данные, которые передают ценную информацию. краткие данные и данные, сгруппированные по хэштегам. Таким образом, Twitter становится исключительным набором данных для проведения сентиментального анализа.