Зачем машинам нужны люди

Если вы следите за серией KMeansWhat, вы уже знаете, что решения ИИ не так волшебны, как их представляет маркетинг. В то время как алгоритмы и модели машинного обучения могут быть построены только на данных, типичные корпоративные приложения, созданные с использованием обучения с учителем, требуют помеченных данных. Вы можете думать о метке как об ответе, который модель должна изучить, чтобы делать прогнозы на будущее. В некоторых случаях людям необходимо либо предоставить, либо подтвердить метку. Общим термином для людей, помогающих машинному обучению, является обучение человека в цикле.

Человек в петле

Человек в петле может проявляться во многих формах. Вы, вероятно, использовали услуги, которые, как вы думали, были предоставлены искусственным интеллектом, которые могли поддерживаться человеком. Подумайте о первом сканере визитных карточек, который создал контакт со всей нужной информацией. Или сканер чеков, привязанный к вашему приложению расходов. Или приложение для фотографий, которое распознает вашу семью и друга. Сначала требовалось, чтобы люди выполняли работу. Даже после того, как машины научились надежно распознавать символы на изображении, они не понимали, как визитная карточка или квитанция имеют структуру для анализа и извлечения различных полей. Пока люди за кулисами преобразовывали карту в контакт, они также обучали машины. Со временем модель улучшается и заменяет или уменьшает потребность в человеческом вмешательстве.

Тот же сценарий применим ко многим интеллектуальным решениям. Чат-боты не знают, о чем вы просите, пока у них не будет диалогов или сценариев для обучения. Беспилотные автомобили не понимают, что представляют собой желтые и белые линии, пока мы не дадим им множество примеров того, как на них реагировать.

Маркировка данных

Иногда метки предоставляются как часть транзакции процесса. Агент службы поддержки присваивает инциденту категорию или группу разрешения. В других случаях вы можете добавлять метки постфактум, не зная, что обучаете модель. Например, когда вы отмечаете лицо друга на фотографии, чтобы помочь вам найти его позже. В более сложных случаях вам может понадобиться кто-то, кто просматривает и маркирует (аннотирует) данные для конкретной цели обучения модели.

Аннотирование данных может быть таким же простым, как одна метка или классификация. Более сложным примером является определение частей речи, именованных сущностей или тональности в неструктурированном тексте. Примерами компьютерного зрения могут быть обнаружение и маркировка объекта на изображении или видео.

В случаях, требующих значительного человеческого труда, можно использовать краудсорсинговые платформы, такие как Amazon Mechanical Turk или Figure Eight (ранее Cloudflower), или специальные службы аннотаций, такие как Appen.

Активное изучение

Предыдущие примеры основаны на том, что люди предоставляют информацию до того, как модель использует данные для обучения или улучшения. Другой пример, когда люди могут помочь, называется «активное обучение». Это не так универсально, как кажется, большинство моделей будут продолжать активно учиться и совершенствоваться, используя последние данные. Это не то, о чем мы говорим здесь.

Активное обучение обычно используется, чтобы помочь улучшить модель, помогая делать прогнозы с более низкой достоверностью. Прогнозы модели основаны на некоторой мере достоверности, поэтому машины могут запрашивать помощь в случаях, когда ее достоверность низкая или ниже заданного порога. В этих случаях человек не просто дает метку, как при обучении с учителем, он обеспечивает обратную связь по прогнозу модели. Машина узнает, какие прогнозы она делает правильные или неправильные.

Модели активного обучения обычно оптимизируются, чтобы понять, на каких данных лучше всего учиться и когда ему нужна помощь. В результате повышается производительность при меньшем объеме данных. Поскольку маркировка сложных данных может занимать много времени и средств, ценно все, что ускоряет этот процесс.

Если вы хотите увидеть несколько примеров активного обучения, посмотрите живую демонстрацию на Prodigy. Вот кадр из модели обнаружения объектов компьютерным зрением. Человеку не нужно беспокоиться об описании изображения. Им нужно только подтвердить или отклонить предсказанную метку. Пользователь также может видеть прогресс от своего участия.

Потенциальные побочные преимущества активного обучения

Есть какое-то странное чувство выполненного долга и вклада в этот тип работы. Я на самом деле чувствую, что помогаю машине стать умнее. Это не всегда так, когда вам нужно заполнить электронную таблицу или форму с метками аннотаций.

Работу также можно делегировать небольшими порциями. Допустим, вы взаимодействуете с чат-ботом виртуального помощника, и он предоставляет то, что вам нужно. В обмен на свои услуги он может задать вам простой вопрос, и за считанные секунды вы помогли сделать его умнее.

Для любителей геймификации также есть возможность геймифицировать этот процесс. Очки тому, кто больше учит машину?

На предприятии по-прежнему много колебаний и недоверия к машинным решениям. Я вижу, что акт проверки машинных прогнозов потенциально повышает доверие бизнес-пользователя к системе.

Если вы уже используете активное обучение в своей среде, поделитесь своим опытом.