Обсуждение популярных подходов - обучение с учителем, обучение без учителя и обучение с подкреплением.

Алгоритмы машинного обучения - это набор алгоритмов, имитирующих поведение при обучении в вычислительных системах. Эти алгоритмы изучают закономерности на основе данных, которые затем могут использоваться для прогнозирования или вывода новых знаний из новых невидимых данных. Есть много подходов к машинному обучению. Самые популярные из них классифицируются как контролируемое, неконтролируемое и обучение с подкреплением.

Как контролируемое, так и неконтролируемое обучение - это методы машинного обучения (ML). Однако они очень разные. Позвольте мне проиллюстрировать использование воображаемого робота, способного к обучению, и корзины фруктов.

Что такое обучение без учителя?

Вы ставите корзину, полную яблок и апельсинов, перед роботом и просите его сгруппировать их на две группы на основе сходства. Робот начнет изучать каждый фрукт и складывать яблоки в одну корзину, а апельсины - в другую. Это связано с тем, что робот использует сходство как способ судить, в какую корзину нужно поместить каждый фрукт.

Яблоки больше похожи на другие яблоки, чем на апельсины, и наоборот. Робот, кажется, понимает, когда он изучает концепции яблочности, когда он исследует яблоки, и апельсиновый цвет, когда он исследует апельсины. Это пример обучения без учителя.

Однако он до сих пор не знает названий фруктов. Потому что вы никогда не говорили роботу, как называются фрукты. Обучение без учителя - это метод обучения, который заставляет обучающегося агента изучать характерные особенности групп вещей без участия человека.

Что такое контролируемое обучение?

Вы даете роботу корзину с фруктами. Вы собираете каждый фрукт и говорите роботу, что это такое - яблоко или апельсин. Затем робот узнает яблочность от всех яблок, которые вы ему показали, и апельсин со всех апельсинов, которые ему показали. Он не только изучает концепции яблочности и оранжевости, он также узнает, как они называются. Узнав их, он может затем, используя модели яблочности и оранжевости, классифицировать любой новый фрукт - будь то яблоко или апельсин. Это пример обучения с учителем.

Поскольку этот подход предполагает, что человек маркирует пример (например, фрукт) именем класса (например, яблоко / апельсин), он называется контролируемым подходом.

Что ж, есть еще один популярный метод машинного обучения - Reinforcement Learning или сокращенно RL.

Что такое обучение с подкреплением?

Позвольте мне просто продолжить нашу маленькую историю про роботов. Вы хотите, чтобы робот научился чистить апельсин или нарезать яблоко определенным образом. Это задание требует от робота выучить последовательность шагов - взять разделочную доску, положить разделочную доску на стол, поместить и удерживать яблоко на разделочной доске определенным образом, выбрать нож, разрезать яблоко на несколько частей и подать. Робот должен выучить эту последовательность методом проб и ошибок. Это пример обучения с подкреплением.

Вы предоставите ему только среду - разделочную доску, стол, нож и сотни яблок, чтобы практиковаться, делать ошибки и учиться. Вы также должны дать ему четкое представление о том, каким должно быть окончательное состояние яблока, когда оно будет нарезано. Вы также предоставите себе (или кому-либо еще) возможность судить и оценивать каждое испытание. Если робот достигнет точки, на которой яблоко было нарезано нужным вам способом, вы поставите ему полную оценку. Оценки, которые он выставляет после каждого испытания, будут служить подкреплением и путем проб и ошибок, в конечном итоге, он выучит правильную последовательность.

Надеюсь, это помогло вам понять разницу между тремя основными подходами к машинному обучению. Я очень хочу услышать ваше мнение.