Типы машинного обучения
- Контролируемое обучение
- Обучение без учителя
- Обучение под наблюдением
- Обучение с подкреплением
Что такое контролируемое обучение?
Машинное обучение с учителем применяет то, чему оно научилось на основе прошлых данных, и применяет их для получения желаемого результата. Обычно их обучают с использованием определенного набора данных, на основе которого алгоритм выводит предполагаемую функцию. Он использует эту предполагаемую функцию для прогнозирования конечного результата и обеспечивает его приближение.
Это называется обучением с учителем, потому что алгоритм необходимо обучать с помощью определенного набора данных, чтобы помочь ему сформировать предполагаемую функцию. Набор данных четко помечен, чтобы помочь алгоритму лучше «понимать» данные. Алгоритм может сравнить свой вывод с помеченным выводом, чтобы изменить свою модель, чтобы она была более точной.
Что такое обучение без учителя?
При неконтролируемом обучении данные обучения по-прежнему предоставляются, но они не будут помечены. В этой модели алгоритм использует данные обучения, чтобы делать выводы на основе атрибутов данных обучения, исследуя данные, чтобы найти какие-либо шаблоны или выводы. Он формирует свою логику для описания этих паттернов и основывает на этом свой вывод.
Что такое частично контролируемое обучение?
Это похоже на два предыдущих, с той лишь разницей, что в нем используется комбинация как размеченных, так и неразмеченных данных. Это решает проблему необходимости маркировать большие наборы данных — программист может просто пометить небольшое подмножество данных и позволить машине вычислить остальное на основе этого. Этот метод обычно используется, когда маркировка наборов данных невозможна либо из-за больших объемов, либо из-за отсутствия квалифицированных ресурсов для их маркировки.
Вот короткое видео, объясняющее различные типы машинного обучения:
Что такое обучение с подкреплением?
Обучение с подкреплением зависит от среды алгоритмов. Алгоритм обучается, взаимодействуя с наборами данных, к которым у него есть доступ, и методом проб и ошибок пытается обнаружить «награды» и «штрафы», установленные программистом. Алгоритм стремится максимизировать эти вознаграждения, которые, в свою очередь, обеспечивают желаемый результат. Это называется обучением с подкреплением, потому что алгоритм получает подкрепление о том, что он на правильном пути, в зависимости от вознаграждений, с которыми он сталкивается. Обратная связь с вознаграждением помогает системе моделировать свое будущее поведение.
Если вас интересует область ИИ и вы хотите узнать больше об этом предмете, ознакомьтесь с Программой PG Great Learning по искусственному интеллекту и машинному обучению.