Машинное обучение позволяет компьютерам автоматически обучаться на основе прошлых данных и опыта. Некоторыми примерами машинного обучения, которые мы используем в реальной жизни, являются обнаружение спама в электронной почте, распознавание речи, распознавание изображений.

Типы машинного обучения

Машинное обучение можно разделить на 3 категории:

  1. Контролируемое обучение
  2. Неконтролируемое обучение
  3. Обучение с подкреплением

Контролируемое обучение

Обучение с учителем — это простой метод машинного обучения, в котором мы передаем помеченные данные для моделирования и обучения, на основе помеченных данных он прогнозирует результат. Это очень точный и надежный метод.

Некоторый контролируемый алгоритм

  1. K-значит соседи
  2. Линейная регрессия
  3. Нейронная сеть
  4. Логистическая регрессия
  5. Деревья решений и случайный лес

Обучение без учителя

При неконтролируемом обучении данные не маркируются. Неконтролируемое обучение является сложным, оно позволяет модели работать самостоятельно, чтобы обнаруживать закономерности. В этом обучении пользователю не нужно контролировать модель.

Какой-то неконтролируемый алгоритм

  1. K- означает кластеризацию
  2. K- ближайшие соседи (KNN)
  3. Априорный алгоритм
  4. Алгоритм Экла

Обучение с подкреплением

Обучение с подкреплением основано на обучении на основе обратной связи. Агент обучения будет наблюдать, как среда получает вознаграждение за правильное действие и штраф за неправильное действие. Агент должен учиться сам.

Некоторый алгоритм обучения с подкреплением

1. Q-обучение

2. Глубокий детерминированный градиент политики (DDPG)

3. Сеть Deep Q