Анализ настроений очень важен для опросов общественного мнения и избирательных кампаний. Например, мы ежегодно рассылаем множество анкет для опросов, в которых запрашиваются мнения и комментарии по различным темам, которые обычно включают несколько открытых вопросов, позволяющих респондентам заполнять все, что они хотят. Тем не менее, их чрезвычайно сложно проанализировать, особенно когда вам нужно разделить их на несколько простых категорий, таких как поддерживающие, противодействующие или нейтральные. Например, когда в ответе говорится: «Это неплохо, но может быть лучше», следует ли классифицировать его как положительный или нейтральный? Иногда реакция людей может быть сложной из-за двойного отрицания. Например, когда говорится: «Товар не без дефектов», может потребоваться интеллектуальная машина, чтобы правильно его интерпретировать.

В избирательной кампании также очень важно знать настроения избирателей до даты голосования, чтобы оценить шанс на победу и определить стратегии последнего момента. Несмотря на то, что сейчас есть социальные сети, в которых избиратели могут выразить свои опасения, их очень сложно анализировать, не говоря уже о сложности их классификации на «За» или «Против».

В настоящее время существует несколько инструментов машинного обучения (ML) для анализа настроений. Но консультанты берут очень высокую плату за анализ. Можем ли мы сделать это сами?

Может потребоваться программа машинного обучения для обучения компьютера анализу ответов. К счастью, сейчас есть несколько готовых бесплатных программ для ознакомления. Например, MonkeyLearn.com (только что приведенный в качестве примера, и я не интересуюсь компанией) предоставляет бесплатную программу анализа текста для анализа настроений. Конечно, он очень ограничен, но все же хорош для изучения удовольствия от обучения машины тому, как анализировать тональность ответов.

Однако, в отличие от экспертной системы, машинное обучение требует, чтобы кто-то обучил машину, прежде чем она сможет получить опыт анализа настроений. Другими словами, если тренер неправильно интерпретирует ответы, машина будет следить за ошибками тренера. Чтобы узнать о требованиях к обучению ML, обратитесь к моей предыдущей статье на Yiu (2019).

На рисунке 1 показан обучающий пример инструмента машинного обучения. Вы должны сообщить машине, следует ли классифицировать этот ответ как положительный, отрицательный или нейтральный. Чем больше примеров вы обучаете машине, тем выше будет точность анализа, потому что я полагаю, что он основан на поиске по ключевым словам, как показано на рисунке 2.

После тренировки вы можете попробовать проверить точность анализатора, набрав или предоставив разные ответы. Это также сообщит о достоверности предположения. Я обнаружил очень забавные результаты, когда мы вводили очень сложные ответы. Это весело!

Давайте попробуем проанализировать ваши мнения в моем блоге. Вот форма опроса, состоящая всего из 4 вопросов, без каких-либо личных данных, https://www.surveymonkey.com/r/SFH6X28

Первые два вопроса помогут классифицировать ваши комментарии. Это помогает тренировать машину, не слишком полагаясь на человека-тренера. Если первые два ответа имеют высокие баллы, то комментарий, скорее всего, будет положительным. Так что не забудьте ввести свои письменные комментарии, чтобы он мог научить машину анализировать настроения читателей в будущем. Я сообщу вам результаты анализа, если у нас будет более 50 ответов. Развлекайся!

(Эта статья предназначена для серии Data Intelligence)

использованная литература

Ю, C.Y. (2019) От автоматизации к машинному обучению, среда 3 января. Https://medium.com/@ecyY/from-automation-to-machine-learning-c61fefe483f5