Размытые границы контролируемого и неконтролируемого обучения

Самоконтроль, полу-контроль и слабый контроль

Когда вы начнете изучать машинное обучение, вы быстро узнаете о контролируемом и неконтролируемом обучении. Два разных подхода, которые решают два разных типа проблем.

Поскольку машинное обучение и особенно глубокое обучение развиваются с большой скоростью, все становится немного сложнее. Граница между контролируемым и неконтролируемым, похоже, стирается, и в настоящее время большую популярность набирают три новых вида обучения. Прежде чем перейти к новому, давайте кратко рассмотрим двух обычных подозреваемых.

Контролируемое обучение

Обучение с учителем - это поиск карты, которая преобразует набор входных функций в заранее определенный набор выходных функций. Другими словами, мы явно сообщаем модели, что мы хотим прогнозировать для обучающих данных. При контролируемом обучении возникает проблема, заключающаяся в том, что нам нужно вручную пометить наши данные, чтобы определить пространство вывода для каждой выборки.

Неконтролируемое обучение

При обучении без учителя мы также заинтересованы в нахождении сопоставления с выходным пространством, но мы не знаем, как эти выходные данные выглядят. Или, по крайней мере, мы не передаем эту информацию в алгоритм. Наиболее распространенным примером обучения без учителя является кластеризация, при которой мы делим выборки на группы в зависимости от их наиболее отличительных черт.

Самостоятельное обучение

Самостоятельное обучение - это подход, при котором ярлыки могут быть созданы автоматически. Сама архитектура и процесс обучения полностью контролируются, но нам не требуется вручную маркировать данные обучения.

Пример 1: автоэнкодеры

Классическим примером этого являются автоэнкодеры, в которых входные и выходные данные полностью совпадают. Цель их архитектуры - сначала сжать входной сигнал до плотного формата, а затем восстановить исходный сигнал. Делая это, автоэнкодеры изучают конкретную проблему сжатия данных с потерями, что может быть полезно для извлечения функций или сокращения данных.

Пример 2: сверхвысокое разрешение изображения

Другой пример - сверхвысокое разрешение изображения, при котором мы масштабируем изображение, пытаясь восстановить новую информацию о пикселях на основе семантического содержания. Если вы хотите создать набор данных для такой проблемы, все, что вам нужно, - это набор немаркированных изображений. Чтобы пометить их, вы можете уменьшить исходные изображения и использовать их в качестве входных данных. На выходе будут изображения исходного размера. В этом случае вам не нужно было ничего вручную маркировать. Вы автоматически сгенерировали помеченные тренировочные данные из немаркированных тренировочных данных.

Полу-контролируемое обучение

Полу-контролируемое обучение играет важную роль, когда ваши тренировочные данные имеют только частичную маркировку. Вы найдете множество наборов данных в Интернете, где помимо аннотированных образцов вы также получите дополнительные данные, которые не имеют ярлыков. Поскольку все данные являются хорошими данными, это потенциально может помочь вам улучшить вашу модель.

Пример: псевдо-маркировка

Псевдо-метки - это процесс прогнозирования меток для данных, для которых у нас нет меток, и использования этих прогнозов в качестве достоверных меток для расширения нашего набора данных. Хотя это, вероятно, внесет шум в наши данные, эксперименты показали, что это может помочь повысить точность модели. Если вас это удивляет, значит, вы не одиноки.

Слабо контролируемое обучение

Под слабо контролируемым обучением понимается модель, которая прогнозирует дополнительную информацию на основе ярлыков, на которых она была обучена. Вы можете думать об этом как об обучении без учителя поверх обучения с учителем.

Пример: сегментация по классификационным меткам

Представьте, что вы обучаете классификатора различать разные типы объектов, которые содержатся где-то на изображении. CNN научится создавать тепловые карты для каждого класса, где, по его мнению, этот объект должен находиться в кадре. Таким образом, он может сравнивать площадь и вероятность одного объекта с другими. Хотя мы обучаем сеть только информации, которая верна для всего кадра, мы также получаем информацию о том, где в кадре расположен объект.

Повсюду вы найдете разные определения этих терминов. Некоторые из них кажутся неточными, потому что они устарели, некоторые, кажется, объединяют термины, которые я явно различаю, а другие высказывают мнения, с которыми я просто не согласен. Пожалуйста, оставьте комментарий, если вы не согласны с моим.