Возможно, вы слышали о машинном обучении и, возможно, даже слышали об анализе настроений. Они могут показаться вам модными словами, как и суперпродукты, они приходят и уходят, как вы думаете. И действительно, что для вас сделал анализ настроений? Как мы можем адаптировать его, чтобы помочь нам с повседневными финансовыми услугами или даже с операционными задачами? Давай исследуем

Пару недель назад я сидел на совещании по машинному обучению в Бате и задавался вопросом. Темой вечера было обучение модели распознаванию положительных или отрицательных рецензий на фильмы. Используя анализ настроений, вы используете изучение текста, чтобы определить отношение писателя. Он уже широко используется компаниями для обнаружения положительных и отрицательных отзывов или комментариев, что позволяет им напрямую взаимодействовать с авторами. Это также топливо, которое определяет, является ли электронное письмо СПАМом или нет. В последние годы появилось более широкое применение. Bloomberg, например, работает над прогнозированием рыночных движений на основе настроений в новостях и социальных сетях (см. Https://www.bloomberg.com/company/announcements/trending-on-twitter-social-sentiment-analytics/) .

Но как, спросите вы, как машинное обучение и сентиментальность могут помочь во всем этом?

В самом широком смысле машинное обучение - это обучение с учителем. Вы предоставляете основу для своей программы и позволяете ей учиться на существующих данных, чтобы затем она могла запускаться и принимать решения самостоятельно.

На семинаре мы обучили наш алгоритм определять, является ли рецензия на фильм положительной или отрицательной, используя данные полярности, которые были собраны Стэнфордским университетом и состоят из 5331 рецензии для каждого настроения. Но сначала нужно обучить своего бота. Мы использовали 2500 обзоров каждого набора, чтобы определить словарь, список всех уникальных слов, присутствующих в каждом наборе данных. Затем набор инструментов для естественного языка создал группы (векторы) отрицательных и положительных наборов слов. И наконец, вам нужно решить, какой алгоритм вы используете для выполнения расчетов. Мы использовали наивный байесовский классификатор, который просматривает каждое слово и вычисляет его индивидуальную вероятность быть положительным или отрицательным. Если вам интересно, это обычно считается наивным, поскольку предполагает не корреляцию, а независимость каждого слова.

На последнем этапе мы протестировали нашего бота во всех обзорах, и нам удалось достичь общей точности 75% (для сравнения, подход, основанный на чистых правилах с использованием классифицированного людьми лексикона, дал только общую точность 55% для того же самого. данные).

Для нас, работающих в мире финансов, это может помочь более эффективно классифицировать общение с клиентами и упорядочить их в порядке приоритета от отрицательного к положительному, что гарантирует, что мы сначала обрабатываем гневные и расстроенные запросы или сразу же перенаправляем их в группу специалистов. Или мы используем чат-бота, который можно запрограммировать на распространение ситуации до ее обострения. Это может быть даже лучше, поскольку мы, люди, склонны оправдывать свои действия и принимать жалобы лично, тогда как бот мог бы научиться справляться с этой ситуацией наиболее эффективным способом на основе предыдущего опыта. Мы даже можем ориентироваться на модели или предлагать определенные инвестиции для наших клиентов на основе предыдущих настроений и поведения. А анализ настроений может даже помочь в финансовых преступлениях и использоваться для обнаружения мошенничества, поскольку он будет иметь доступ ко всем сообщениям с клиентами и, следовательно, обнаруживать необычные настроения в более широком масштабе.

В SECCL Technology я также буду стремиться обучить чат-бота и буду держать вас в курсе, как у нас дела.