Контролируемое обучение

Машинное обучение под наблюдением – это подкатегория машинного обучения и искусственного интеллекта.

Это один из вводных алгоритмов в концепциях машинного обучения, который чаще всего используется для анализа данных.

Алгоритмы контролируемого обучения имеют решающий результат. Сравнение моделей проще в обучении с учителем и выполняется с использованием ошибки прогнозирования.

Обучение с учителем осуществляется двумя способами: регрессией и классификацией.

Регрессия

Регрессия используется, когда выходная переменная является непрерывной по своей природе или имеет действительное значение. Примерами являются предсказание акций, ценообразование дома/автомобиля.

Типы регрессии:

Простая линейная регрессия

Эта регрессия используется для понимания связи между двумя переменными. Одна переменная является независимой, а другая является зависимой переменной.

Формула: у= мх+с

Полиномиальная регрессия

Эта регрессия используется для прогнозирования значения с использованием 2 или более независимых переменных.

Y = a+b1x1+b2x2+…..

Ридж-регрессия

Это расширение линейной регрессии, которое добавляет штраф за регуляризацию к функции потерь во время обучения.

Это метод анализа данных множественной регрессии, которые страдают от мультиколлинеарности. Мультиколлинеарность – это наличие высокой корреляции между двумя или более независимыми переменными.

Чтобы уменьшить мультиколлинеарность и высокую дисперсию, к функции потерь добавляется квадрат смещения.

Использует метод регуляризации L1.

Лассо-регрессия

Лассо-регрессия также добавляет смещение, чтобы уменьшить эффект мультиколлинеарности и высокой дисперсии, как регрессия хребта, но здесь добавляется абсолютное значение вместо квадрата смещения.

Лассо-регрессия не только помогает уменьшить переоснащение, но и может помочь нам в выборе функций.

Использует метод регуляризации L2.

Используется для точного предсказания

Лассо-регрессия использует сжатие, при котором значения данных сжимаются по направлению к центральной точке, такой как среднее значение.

Классификация

Классификация используется, когда выходная переменная является категориальной. Примеры: спам/не спам, мужчина/женщина.

Типы классификации:

Бинарная классификация

Двоичная классификация — самый простой из всех алгоритмов машинного обучения.

Приведенные данные разбиты на два класса. например: мужчина или женщина. Правда или ложь.

Логистическая регрессия является наиболее часто используемым алгоритмом бинарной классификации.

Логистическая регрессия

Модель логистической регрессии предсказывает зависимую переменную данных, анализируя взаимосвязь между одной или несколькими существующими независимыми переменными.

Логистическую функцию также называют сигмовидной функцией.

Многоуровневая классификация

Это используется, когда имеется три или более классов и данные принадлежат одной или нескольким меткам классов. Пример: классификация фотографий. На фотографии может быть несколько объектов. Таким образом, каждый выход будет иметь несколько объектов.

Популярные алгоритмы, которые используются для классификации с несколькими метками:

  1. Деревья решений с несколькими метками
  2. RandomForest с несколькими метками
  3. Повышение градиента с несколькими метками

Многоклассовая классификация

Это используется, когда для выходной метки имеется три или более классов. И данные принадлежат только этим классам. Пример: классификация лиц.

Популярные алгоритмы, которые используются для многоклассовой классификации:

  1. Решение Тресс
  2. КНН
  3. Случайный лес
  4. Повышение градиента