Введение в машинное обучение, контролируемое, неконтролируемое обучение и обучение с подкреплением

Кто должен читать этот блог?

Если вы новичок в машинном обучении и хотите изучить понятия, связанные с определениями и различиями между обучением с учителем, обучением без учителя и обучением с подкреплением.

Это мой самый первый блог, посвященный машинному обучению. Здесь я попытался расшифровать точное значение терминов «машинное обучение», «обучение с учителем», «обучение без учителя» и «обучение с подкреплением».

Определение машинного обучения:

Если кто-то попросит меня ответить на вопрос, что такое ML? я бы ответил, что это "Вычислительная статистика". О, это действительно так? Одни говорят, что это прикладная статистика. Итак, я изменю свой ответ на «Вычислительно-прикладная статистика». Но это не отвечает на вопрос с хорошей глубиной. Следовательно, что такое ML, можно ответить так:

Создание вычислительных артефактов (лучшего слова здесь не подобрать), которые со временем учатся на основе опыта. Помимо создания артефакта, в машинном обучении задействовано множество математических, инженерных и вычислительных концепций.

Контролируемое обучение:

Итак, что же такое контролируемое обучение? Мне нравится идея найти простое значение слова в английском словаре, прежде чем понимать его как технический/формальный термин, так что вот оно:

Ха… теперь мне легче объяснить обучение с учителем. Проблема взятия помеченного набора данных и извлечения из него некоторой информации для дальнейшей маркировки невидимых данных.

Рассмотрим следующие входные и выходные значения, и если я спрошу вас, что будет на выходе для входного значения 10? скорее всего, ответ был бы 11, и это могло бы привести к тому, что для предыдущих значений входных данных выход был input_value + 1. Но мы никогда не знаем, это может быть и неправильно, скажем, у меня есть какое-то другое выходное значение для входного значения 10.

В широком смысле контролируемое обучение можно рассматривать как аппроксимацию функции. В нем задействованы некоторые предположения, также есть предположение, что существует хорошо работающая функция. Итак, в основном это обобщение, а обобщение — фундаментальная проблема машинного обучения.

Обучение под наблюдением также может быть выражено с помощью другого термина Индукция. Индукция означает переход от конкретных примеров к чему-то общему. Кроме того, на сцену выходит понятие индуктивного смещения (обсуждение его выходит за рамки этого блога).

Итак, в конце концов, обучение с учителем — это аппроксимация функции(пища для размышлений, или это аппроксимация индуктивной функции?).

Обучение без учителя:

В отличие от обучения с учителем, входные данные не снабжены метками, есть просто входные данные, и мы должны вывести некоторую структуру из входных данных, глядя на взаимосвязь между самими входными данными. Таким образом, обучение с учителем больше связано с приближением, а обучение без учителя больше связано с описанием (обратите внимание, что описание может быть не очень описательным, оно может быть очень точным).

Примером неконтролируемого обучения может быть то, что вы смотрите на изображение толпы и начинаете разделять людей на основе некоторых наблюдений, таких как длина волос, наличие бороды — отсутствие бороды, одежда и т. д. Мы пока не знаем, мы наблюдали за вещами, которые помогли бы нам достичь цели (цель может заключаться в том, чтобы получить несколько мужчин и женщин, количество людей с бородой и без бороды), но да, неконтролируемое обучение работает так, нужно отделить экземпляры, просматривающие отношения во входных данных.

Можно ли использовать обучение без учителя для улучшения обучения с учителем, чтобы лучше выполнять аппроксимацию функций? (Пища для размышлений). Следующее изображение отвечает на вопрос и его использование.

Обучение с подкреплением:

Обучение с подкреплением — это обучение на основе отсроченных вознаграждений. Обратная связь в обучении с подкреплением может появиться через несколько шагов после того, как она была фактически получена.

Например, я начинаю играть с вами в крестики-нолики, не сообщая вам правил, и продолжаю играть, и, наконец, я выиграл. Тогда вы поймете, что на каком-то этапе игры вы сделали что-то не так, из-за чего вы проиграли игру. Так что здесь в дальнейшем для решения такого рода задач на свет выходит обучение с подкреплением.

Вывод:
Все перечисленные выше проблемы (контролируемые, неконтролируемые и подкрепления) в совокупности можно рассматривать как проблемы оптимизации.
При обучении с учителем необходимо улучшить оценки размеченных данных (оптимизация), при обучении без учителя необходимо улучшить оценки кластеров (оптимизация), а при обучении с подкреплением необходимо улучшить показатели поведения (оптимизация).

Введение в машинное обучение, контролируемое, неконтролируемое обучение и обучение с подкреплением

Вопросы по теме