Почему API Microsoft Text Analytics возвращает нейтральную тональность для предложения с сильным негативным оттенком?

Я пытаюсь создать приложение для анализа настроений данных опроса с помощью Microsoft Analytics API. Один из ответов на опрос имеет сильный негативный оттенок.

Лично в мире нет ни одной компании, которой нужен этот продукт товар

но API возвращает 50 баллов. В чем причина этого?


person Pankaj    schedule 12.02.2018    source источник


Ответы (1)


Я только что попробовал на их странице, и похоже, что она изменилась и сообщает о настроении 73%.

Настроение

Хотя я думаю, что знаю почему. В «ключевых фразах» слово «не» не подобрано. Глядя на стоп-слова из nltk, кажется, что "не" - это стоп-слово.

from nltk.corpus import stopwords

stop_words = stopwords.words("english")

[word for word in stop_words if word == "not"]  # Returns ['not']

Поскольку слово «не» могло быть удалено как стоп-слово, нет негатива, который мог бы создать негативное настроение.

person Jon    schedule 14.03.2018