Это хорошая проблема: что, если ваша организация получает больше отзывов аудитории и запросов на информацию, чем вы можете обработать? Вы же не хотите, чтобы ваша встревоженная общественность висела на месте (особенно во время стихийных бедствий, экстренных новостей или пандемии). Но вы также не можете позволить своей команде работать без перерыва. Вам нужна помощь, чтобы понять, чему отдать предпочтение. Именно здесь может помочь новейшая функция Hearken's Engagement Management System — наш инструмент автоматической классификации.

(Этот пост является продолжением статьи Классификация вовлеченности: Hearken выигрывает финансирование от GNI Innovation Challenge, в котором рассказывается о том, что мы создаем, как это работает до сих пор и что оно сможет сделать. когда это будет сделано.)

Новый инструмент классификации Hearken принимает вопросы и ответы, которые редакции получают от своей аудитории через формы Hearken, и сортирует их по группам на основе текстового сходства. Это позволяет редакциям новостей понять, что больше всего интересует их аудиторию, без необходимости вручную сортировать каждую из сотен или тысяч представленных аудиторией материалов.

Инструмент использует обработку естественного языка с поддержкой машинного обучения для группировки материалов аудитории по тематическим областям. В настоящее время инструмент классификации используют три отдела новостей, и мы распространим его еще на несколько, а вскоре и на всех наших партнеров.

Как это было раньше. Когда редакция новостей получала большое количество вопросов от аудитории, кому-то из сотрудников редакции приходилось вручную группировать похожие ответы вместе. Когда KQED получил сотни вопросов о бездомности, продюсер потратил полдня на то, чтобы разделить заявку на списки, чтобы определить, что больше всего интересовало людей. Это помогло сформировать репортаж в стиле часто задаваемых вопросов, который напрямую отвечал на вопросы аудитории, но на его сборку ушло много времени.

Как это может быть сейчас. Когда кто-то в отделе новостей указывает, что группа материалов готова к сортировке, платформа Hearken автоматически группирует их с помощью системы обработки естественного языка с поддержкой машинного обучения. Обработка естественного языка означает, что система может читать и «понимать» сходство между отправленными сообщениями. Машинное обучение означает, что если журналист вручную сортирует или переназначает материал, эта система будет использовать эту обратную связь для более точной сортировки будущих материалов.

Используя эти автоматически созданные группы, журналисты могут эффективно определять области, в которых их аудитория больше всего нуждается в ответах, затрачивая гораздо меньше времени на сортировку вопросов. Это также облегчает отделу новостей возможность отвечать всем, кто задавал подобные вопросы, после того, как был получен ответ. А с большим количеством людей, у которых есть ответы, они могут принимать более обоснованные и правильные решения в своей жизни (то есть цель журналистики).

Инструмент классификации в действии

Для Общественного радио Южной Калифорнии (KPCC + LAist) инструмент обнаружил сходство и отсортировал сообщения, связанные с вакциной против COVID, по одной из четырех тем: даты и места второй дозы; время ожидания и логистика; расстановка приоритетов; или симптомы, побочные эффекты и лекарства.

Наши партнеры смогут применять это машинное обучение для сортировки любого списка вопросов по темам. Поскольку мы наблюдаем, как все больше партнеров создают вопросы аудитории для каждого репортера и превосходят его (отличный пример — Crosscut), мы рады видеть, как этот инструмент в сочетании с проверенным общедоступным процессом Hearken может сэкономить время каждого репортера. , предоставлять информацию и повышать их уверенность в том, как они тратят свои ресурсы, чтобы приносить максимальную пользу своим сообществам.

Что дальше

Скоро мы развернем интерфейс для редакций, чтобы настроить сортировку по теме самостоятельно, без участия наших инженеров или менеджеров по работе с клиентами (хотя мы всегда рады помочь!).

В этом макете платформа Hearken просит пользователя спрогнозировать, насколько разнообразными будут ответы, и объясняет, что совершенно нормально повторять этот шаг несколько раз, пока вы не найдете золотую середину:

В этом макете пользователь может увидеть, как были разделены материалы, и решить, имеют ли смысл эти разделения.

Кроме того: мы также очень близки к тому, чтобы система работала для сортировки заявок на языках, отличных от английского. Во-первых, мы тестируем материалы на испанском и датском языках. (Забавный факт: Hearken имеет филиал в Северной Европе, базирующийся в Дании, и обслуживает европейские отделы новостей, а также членские и правительственные организации).

Уроки и проблемы

Введение новых концепций. Интерфейс классификации Hearken, вероятно, станет первым разом, когда наши пользователи взаимодействуют с обработкой естественного языка или машинным обучением, и, что еще более вероятно, они впервые обучат модель обработки естественного языка. В результате перед нами стояла задача познакомить наших пользователей с новыми и сложными техническими концепциями в интерфейсе, который по-прежнему кажется знакомым и простым в использовании. С помощью внешнего дизайнера пользовательского интерфейса и множества полезных бета-тестеров мы уверены, что можем справиться с этой задачей.

Небольшой объем. Каждая модель должна быть обучена с большим количеством реальных отправок (в идеале более 100). Для этого необходимо, чтобы аудитория уже была вовлечена до того, как организация настроит инструмент классификатора. Кроме того, после того, как модель обучена и запущена, аудитория все еще должна быть вовлечена, чтобы редакция новостей увидела преимущества и эффективность ее настройки. Например, в наши дни нашим партнерам по новостям поступает меньше вопросов о COVID-19, поэтому, хотя инструмент классификатора активен, он не экономит им столько времени, сколько шесть месяцев назад, когда объем вопросов требовал автоматической сортировки. . Мы надеемся найти способы определить тот ключевой момент, когда поступает достаточно заявок для обучения модели, но вовлеченность еще не достигла своего пика.

Ограниченные ресурсы для языков, отличных от английского. Многие ресурсы по обработке естественного языка, которые использует наш инструмент классификатора, в основном были разработаны с использованием исходного материала на английском языке. Несмотря на то, что за последние несколько лет они были расширены на другие языки, трудно найти ресурсы, которые так же точны на неанглоязычных языках, как и оригинальная англоязычная версия.

Наша конечная цель

В конечном счете, мы хотим максимально упростить выявление информационных потребностей общественности, их организацию, принятие мер и реагирование на них со стороны отделов новостей, чтобы граждане могли выполнять свою работу и принимать обоснованные решения в своих сообществах.

Мы надеемся, что добавление этой повышающей эффективность функции в Систему управления вовлеченностью Hearken еще больше побудит редакции уделять больше внимания вовлеченности, что, в свою очередь, поможет им быть максимально актуальными и достойными финансовой поддержки.

Повысьте эффективность своей организации

Текущие партнеры Hearken: мы хотели бы добавить вас в нашу группу тестирования! Отправьте заметку по адресу [email protected], если вы заинтересованы.

Если вы еще не являетесь партнером Hearken, свяжитесь с нами здесь. Мы с нетерпением ждем возможности узнать больше о том, что вас интересует, и посмотреть, сможем ли мы поддержать вас и общественность, которой вы служите!

Особая благодарность Julia Haslanger и Кирану Ханрахану за эти идеи и создание этого поста.