Это подход к обучению, который использует помеченные данные и относительно большее количество немаркированных данных для построения классификатора. Это находит применение в тех случаях, когда маркировать большие объемы данных дорого или невозможно, в то время как немаркированные данные легко доступны. Например, при семантической сегментации спутниковых изображений, поскольку для этого требуется, чтобы каждый пиксель был помечен, полууправляемое обучение показало, что точность сегментации можно повысить за счет использования немаркированных данных вместе с ограниченным количеством помеченных данных.

Этот полууправляемый метод обучения основан на нескольких предположениях. Они есть:

  • Плавность/непрерывность. Две близкие точки x1 и x2 в области с высокой плотностью должны означать, что соответствующие метки или цели y1 и y2 также должны оставаться ближе.
  • Предположение кластера. Граница решения должна находиться в области с низкой плотностью.
  • Предположение о многообразии. Многомерные данные лежат на низкоразмерном многообразии.

Обучение с полуучителем можно разделить на два типа в зависимости от прогнозируемого объекта:

  • Трансдуктивное обучение предсказывает метку класса немаркированных данных.
  • Индуктивное обучение предсказывает сопоставление или функцию между входными и целевыми метками.

Общие методы полууправляемого обучения включают регуляризацию согласованности, псевдомаркировку и методы на основе графа.

Регуляризация согласованности

Это обычная техника полуконтролируемого обучения. Ожидается, что если к непомеченным точкам данных будет применено небольшое возмущение, цель не должна существенно измениться. Это также называется тренировкой постоянства.

Псевдомаркировка

Этот метод включает использование обученной модели на размеченном наборе данных для прогнозирования целей для неразмеченных данных, а сформированные выборки в дальнейшем используются в качестве дополнительных обучающих выборок.

Графические методы

В этом классе методов помеченные и неотмеченные точки данных считаются узлами в графе, и метки распространяются от помеченных узлов к неотмеченным узлам на основе сходства узлов.

Исходный пост:



Использованная литература :

[1] Обзор глубокого обучения с полуучителем

[2] Полуконтролируемое обучение