Я пытаюсь выполнить анализ настроений в R. Я хочу использовать лексику afinn или bing, но проблема в том, что я не могу токенизировать слова.
Вот слова, для которых мне нужны сантименты:
Итак, есть 6 слов, для которых я хочу выразить мнение: Pass Fail Not Ready Out of Business Pass w / conditions No entry
Как использовать любой из лексиконов, чтобы определить тональность этих слов
Вот мой код:
d<- as.data.frame(data$Results)
d<- as.data.frame(d[1:2000,])
colnames(d) <- "text"
#Making preprocessed file for raw data
preprocess<-data.frame(text=sapply(tweet_corpus_clean, identity),
stringsAsFactors=F)
# tokenize
tokens <- data_frame(text = preprocess$text) %>% unnest_tokens(word, text)
При запуске я получаю:
Потому что для лексиконов, чтобы определять настроения, в каждой строке должен быть один токен.
Так что мне пришлось объединить эти слова вместе. Теперь, когда я использую afinn, он не может понять, что такое внебизнес
tokens <- data_frame(text = preprocess$text) %>% unnest_tokens(word, text)
contributions = tokens %>%ungroup()%>%
inner_join(get_sentiments("afinn"), by = "word") %>%
group_by(word) %>%
summarize(score = as.numeric(sum(score * n) / sum(n))) %>%
arrange(desc(sentiment))
как мне провести анализ тональности этих 6 типов слов?