Когда кто-то находит время, чтобы изложить свое мнение по теме, читателю обычно довольно легко экстраполировать мнение автора по этому поводу. Возьмем, к примеру, следующие отзывы о ресторанах:

"Ужасный. Я был здесь во время астральной проекции, и все, что я могу сказать, это было самое худшее. Пицца НЕ была хорошей. Сотрудники смотрели на меня, как на какое-то слизистое чудовище, которое собиралось причинить им вред. Вот это да. Не могу сказать, что рекомендовал бы пойти сюда. 1. Пицца = totes ew 2. Сотрудники = totes грубые. Так что ДВА неприятных привкуса во рту !!! Поговорим о том, чтобы поразить двух зайцев одним выстрелом !!!! »

«Я приехал в 2 часа ночи, вошел в дверь в 10 утра и все равно заплатил 10 долларов за куриные палочки из 10 штук и порцию картофеля фри (я смог съесть весь заказ только один раз за моя жизнь, и это было при смягчающих обстоятельствах). Каждый раз я ухожу довольными телом, разумом и душой ».

Довольно просто сделать вывод, что первый отзыв был в целом отрицательным, а второй - положительным. Этот вид наблюдения является формой анализа настроений, который направлен на определение отношения к определенной теме (или общей контекстной полярности) документ.

С точки зрения машинного обучения мы можем проводить анализ тональности текста, используя НЛП, и создавать модели для количественной оценки неструктурированных данных, анализа предпочтений потребителей и эффективного взаимодействия с клиентской базой.

Исторически говоря

Начиная с «Илиады» Гомера, Агамемнону нужно было оценить боевой дух своих людей, чтобы увидеть, готовы ли они к битве. Мы могли бы рассматривать эту «добычу мнений» в древнем контексте. Примерно в пятом веке до нашей эры Афины оценили общественное мнение, которое является рождением голосования и демократии.

Перенесемся в Южную Флориду в 1980-е, Роберт Плутчик и он создали удобоваримую психоаналитическую классификацию человеческих эмоций, также известную как колесо эмоций Плутчика. Он доказывает приоритет этих эмоций, показывая, что каждая из них является триггером поведения, имеющего высокую ценность для выживания, например, как страх вызывает реакцию бей или беги. Исследователи машинного обучения использовали это колесо в качестве основы или целевых настроений при проведении анализа.

Машины обучаются настроениям

Все алгоритмы машинного обучения, используемые сегодня, имеют свои корни в академических кругах, включая обработку естественного языка (или «НЛП»).

До 1960-х годов в большинстве языковых анализов использовалось понятие универсальной грамматики Хомского. В современном контексте ученые (и их алгоритмические коллеги) продвинулись вперед к более вероятностному моделированию языка, звука, изображений и настроений, которые могут быть получены в результате их взаимодействия.

Визуальный анализ настроения

По словам исследователей, 99% всех научных работ по анализу настроений были написаны с 2004 года. Хотя академические теории о настроениях масс были известны в течение некоторого времени, возможность тестирования и экспериментов с этими концепциями была ограничена. Однако с появлением Интернета, более дешевого хранилища данных и вычислительной мощности анализ настроений стал академической границей. В последние годы передовые рубежи были сосредоточены на объединении воображаемых / видеоданных с текстом и звуком, известного как анализ визуального настроения (или «VSA»).

Задачи VSA лежат в основе многих проблем в области машинного обучения сегодня. 1) Необходимо проанализировать огромное количество данных. Например, 300 часов видео загружается на YouTube каждую минуту, а 95 миллионов фотографий и видео публикуются в Instagram в день, все с различным гибким текстом и звуком для сопровождения, если таковые имеются, что приводит ко второму пункту. 2) Дефицит классификации - это идея о том, что, несмотря на наличие такого большого количества необработанных данных, возможность классифицировать их по определенным сегментам может быть трудной, если не невозможной. Сообщения или комментарии, сопровождающие изображение или видео, обычно бывают короткими или вообще отсутствуют (например, комментарии в социальных сетях), а когда есть заметное настроение, способ интерпретации настроения постоянно меняется (например, мемы).

Еще одна интересная проблема для VSA - это дихотомия между эмоциями, которые автор намеревается передать зрителю, и реальными эмоциями зрителя. Подумайте об этом: издатель помечает видео или изображение еды как «вкусно», зрители, скорее всего, отметят «вкусно» или «голодны». Исследования показали, что на определенном количестве примеров этих реакций издателей и зрителей на изображения еды модель сможет лучше предсказать, как зритель отреагирует на данное изображение и описание издателя.

"Одна картинка стоит тысячи слов"

- Все работы по анализу визуальных настроений

Логическим выводом этого типа анализа является то, что у нас будет доступ к моделям, которые смогут предсказать данную реакцию на любое изображение или видео с заданным описанием издателя.

Тем не менее, чтобы прийти к такому выводу, есть свои проблемы. Один из примеров - анализ сложности реакции. Возьмем, к примеру, негативный политический мем ad hominem или нападки. Создатель, связанный с Группой 1, создает мем, предназначенный для незаконной эмоциональной реакции на его основу. Обычно это две очень разные и полярно противоположные реакции:

  1. Согласие членов Группы 1 «обойти Группу 2».
  2. Негативная реакция Группы 2, которая чувствует себя необоснованной атакой со стороны почты.

Затем следующий шаг - своего рода «мета» реакция, когда Группа 1 может обвинить Группу 2 в излишней чувствительности или политкорректности.

Конкретный пример этого обстоятельства, вероятно, хорошо знаком читателю, и здесь нет смысла приводить его. Однако подумайте о конкретных примерах, которые произошли в последнее время, а затем представьте мир, в котором один человек или группа могут создать модель, которая специально порождает этот вид негативного хаоса.

В итоге это стало одним из моих тяжелых постов в блоге, но это интересная тема, которая имеет реальные последствия для того, как мы потребляем медиа в любом современном контексте, и потребует понимания более искушенного потребителя.

Дайте мне знать, что вы думаете! Что вас интересует в анализе настроений машинного обучения? Есть ли общие этические рамки, в которые может вписаться анализ этого типа?

** Благодарю моих партнеров Роба Боскаччи и Зака ​​Ноубла, которые помогли подготовить презентацию Flatiron School Presents, которая легла в основу этого блога. **

** Большая часть академической информации, на которую ссылаются в этом блоге, была получена из этих двух статей: