Типы машинного обучения

  • Контролируемое обучение
  • Обучение без учителя
  • Обучение под наблюдением
  • Обучение с подкреплением

Что такое контролируемое обучение?

Машинное обучение с учителем применяет то, чему оно научилось на основе прошлых данных, и применяет их для получения желаемого результата. Обычно их обучают с использованием определенного набора данных, на основе которого алгоритм выводит предполагаемую функцию. Он использует эту предполагаемую функцию для прогнозирования конечного результата и обеспечивает его приближение.

Это называется обучением с учителем, потому что алгоритм необходимо обучать с помощью определенного набора данных, чтобы помочь ему сформировать предполагаемую функцию. Набор данных четко помечен, чтобы помочь алгоритму лучше «понимать» данные. Алгоритм может сравнить свой вывод с помеченным выводом, чтобы изменить свою модель, чтобы она была более точной.

Что такое обучение без учителя?

При неконтролируемом обучении данные обучения по-прежнему предоставляются, но они не будут помечены. В этой модели алгоритм использует данные обучения, чтобы делать выводы на основе атрибутов данных обучения, исследуя данные, чтобы найти какие-либо шаблоны или выводы. Он формирует свою логику для описания этих паттернов и основывает на этом свой вывод.

Что такое частично контролируемое обучение?

Это похоже на два предыдущих, с той лишь разницей, что в нем используется комбинация как размеченных, так и неразмеченных данных. Это решает проблему необходимости маркировать большие наборы данных — программист может просто пометить небольшое подмножество данных и позволить машине вычислить остальное на основе этого. Этот метод обычно используется, когда маркировка наборов данных невозможна либо из-за больших объемов, либо из-за отсутствия квалифицированных ресурсов для их маркировки.

Вот короткое видео, объясняющее различные типы машинного обучения:

Что такое обучение с подкреплением?

Обучение с подкреплением зависит от среды алгоритмов. Алгоритм обучается, взаимодействуя с наборами данных, к которым у него есть доступ, и методом проб и ошибок пытается обнаружить «награды» и «штрафы», установленные программистом. Алгоритм стремится максимизировать эти вознаграждения, которые, в свою очередь, обеспечивают желаемый результат. Это называется обучением с подкреплением, потому что алгоритм получает подкрепление о том, что он на правильном пути, в зависимости от вознаграждений, с которыми он сталкивается. Обратная связь с вознаграждением помогает системе моделировать свое будущее поведение.

Если вас интересует область ИИ и вы хотите узнать больше об этом предмете, ознакомьтесь с Программой PG Great Learning по искусственному интеллекту и машинному обучению.