Машинное обучение — это область, которая фокусируется на разработке алгоритмов, которые позволяют компьютерам учиться на данных и улучшать свою производительность при выполнении конкретной задачи без явного программирования. Другими словами, машинное обучение — это создание алгоритмов, которые могут учиться на данных, распознавать закономерности и делать прогнозы на основе этих данных. Чтобы изучить и понять различные алгоритмы машинного обучения, жизненно важно понимать различные типы машинного обучения.

Существует три различных типа машинного обучения, а именно: обучение с учителем, обучение без учителя и обучение с подкреплением. Помимо этого, есть еще две категории, а именно полуконтролируемое и активное обучение. Давайте разберемся в этих 5 различных категориях машинного обучения в этой статье.

контролируемое обучение

Обучение с учителем — это тип машинного обучения, при котором компьютеру предоставляются помеченные данные и набор правил, которым необходимо следовать. Цель состоит в том, чтобы делать прогнозы на основе размеченных данных. Помеченные данные используются для обучения модели, а затем обученная модель используется для прогнозирования новых, невидимых данных.

В эту категорию входят два разных типа алгоритмов машинного обучения:

Классификация: цель состоит в том, чтобы предсказать категориальный ярлык (т. е. ярлык, принадлежащий заранее определенному набору) на основе входных признаков.

Пример классификации
Классическим примером классификации является обнаружение спама. Учитывая набор помеченных электронных писем (спам или не спам), модель можно обучить классифицировать новые электронные письма как спам или не спам.

Математические формулы для классификации
Алгоритм обучения с учителем для задач классификации обычно имеет форму распределения вероятностей. Одним из самых популярных алгоритмов для этой задачи является логистическая регрессия. Алгоритм представлен следующей формулой:
P(Y=1|X)= 1/(1+ e^(-w.X -b))

Здесь Y — прогнозируемое двоичное значение, b — матрица смещения, X — матрица входных признаков, а w — матрица весов.

Регрессия: цель состоит в том, чтобы предсказать непрерывное значение (например, цену, вес, температуру) на основе входных признаков.

Пример регрессии.
Классическим примером регрессии является прогнозирование цены дома на основе его размера, местоположения и других факторов.

Математические формулы для регрессии.
Алгоритм контролируемого обучения для задач регрессии обычно представляет собой линейные или полиномиальные уравнения. Один из самых популярных алгоритмов для этой задачи — линейная регрессия. Алгоритм представлен следующей формулой:

Y = b + w1x1 + w2x2 + ... + wn*xn.

Здесь Y — прогнозируемое значение, b — член смещения, x1,x2...xn — входные признаки, а w1,w2...wn — веса.

Неконтролируемое обучение

Неконтролируемое обучение — это тип машинного обучения, при котором компьютеру предоставляются неразмеченные данные, и он должен самостоятельно находить закономерности и взаимосвязи. В этом типе обучения алгоритму не предоставляется правильный вывод, но он должен самостоятельно находить закономерности и взаимосвязи в данных. Основная цель неконтролируемого обучения — обнаружение скрытых структур в данных.

В эту категорию входят два разных типа моделей машинного обучения:

Кластеризация: цель состоит в том, чтобы сгруппировать похожие точки данных вместе.

Пример кластеризации.
Классическим примером кластеризации является сегментация клиентов. Имея набор данных о клиентах (возраст, доход, местонахождение и т. д.), можно использовать алгоритм кластеризации для группировки клиентов со схожими характеристиками.

Математические формулы для кластеризации
Одним из самых популярных алгоритмов для этой задачи является метод k-средних. Алгоритм представлен следующей формулой:
минимизировать ∑i=1 до k ∑x принадлежит C(i) ||x-u(i)||²

Здесь C(i) — набор точек данных, принадлежащих кластеру i, u(i) — центр тяжести кластера i, а k — количество кластеров.

Уменьшение размерности: цель состоит в том, чтобы уменьшить количество признаков в данных, сохраняя при этом как можно больше информации.

Пример уменьшения размерности
Классическим примером уменьшения размерности является сжатие изображения. Для изображения с высоким разрешением можно использовать алгоритм уменьшения размерности, чтобы уменьшить количество пикселей при сохранении как можно большего количества информации.

Математические формулы для уменьшения размерности
Одним из самых популярных алгоритмов для решения этой задачи является анализ главных компонентов (PCA). PCA — это линейный метод, который находит направления (основные компоненты) в данных, которые объясняют наибольшую вариацию. Алгоритм представлен следующей формулой:
X = WY

Здесь X — исходные данные, Y — преобразованные данные, а W — матрица преобразования.

Обучение с подкреплением

Обучение с подкреплением (RL) — это тип машинного обучения, при котором компьютер учится, взаимодействуя со своей средой и получая обратную связь в виде вознаграждений или наказаний. Цель RL — изучить политику, которая максимизирует совокупное вознаграждение с течением времени. В RL агент взаимодействует со средой и учится предпринимать действия, которые максимизируют кумулятивное вознаграждение, которое он получает от среды. Агент учится методом проб и ошибок, корректируя свои действия в зависимости от получаемого вознаграждения.

Пример обучения с подкреплением.
Классический пример обучения с подкреплением — обучение робота навигации к месту назначения. Робот помещается в окружающую среду, и он учится перемещаться к месту назначения, получая награды (положительные или отрицательные) в зависимости от своих действий (например, движение вперед, поворот налево и т. д.).

Математические формулы.
Алгоритм обучения с подкреплением представлен следующей формулой:
Q(s,a) = Q(s,a) + α(r + γmaxa' Q(s',a') - Q(s,a))

Здесь Q(s,a) — ожидаемое совокупное вознаграждение за выполнение действия a в состоянии s и последующее выполнение оптимальной политики, α — скорость обучения, r — немедленное вознаграждение, полученное после выполнения действия a в состоянии s. , γ — коэффициент дисконтирования, а maxa' Q(s',a') — максимальное ожидаемое кумулятивное вознаграждение, достижимое из следующего состояния s' при выполнении любого действия a'.

Алгоритм обучения с подкреплением также представлен следующей формулой:
π(s) = argmaxa Q(s,a)

Здесь π(s) — это функция политики, которая представляет собой отображение состояний в действия, а argmaxa Q(s,a) представляет действие, которое максимизирует ожидаемое совокупное вознаграждение.

Полуконтролируемое обучение

Полууправляемое обучение — это тип машинного обучения, который находится между контролируемым и неконтролируемым обучением. При полууправляемом обучении алгоритму предоставляются некоторые помеченные данные и некоторые немаркированные данные. Цель состоит в том, чтобы использовать размеченные данные для прогнозирования неразмеченных данных. Этот подход удобен, когда размеченных данных мало и их получение дорого.

Использование полуконтролируемого обучения:

При обработке естественного языка, когда доступен большой объем текста, но помечена лишь его небольшая часть, для классификации неразмеченных данных можно использовать полууправляемый алгоритм обучения.
В компьютерном зрении, когда большой набор изображений доступен, но только небольшая часть из них помечена, для классификации немаркированных изображений можно использовать полууправляемый алгоритм обучения.

Алгоритмы обучения с полуучителем обычно представляют собой комбинацию алгоритмов обучения с учителем и без учителя. Одним из самых популярных алгоритмов решения этой задачи является самообучение. Этот алгоритм представлен следующей процедурой:

  1. Обучите модель, используя помеченные данные
  2. Используйте обученную модель для прогнозирования меток на немаркированных данных.
  3. Добавьте наиболее достоверно предсказанные данные в помеченный набор данных
  4. Повторяйте шаги с 1 по 3, пока не будет достигнута желаемая точность.

Другим алгоритмом, который используется в полуконтролируемом обучении, является совместное обучение. Модели для этого алгоритма обучаются следующим образом:

  1. Обучите две модели независимо, используя помеченные данные
  2. Используйте модели для прогнозирования меток на немаркированных данных.
  3. Объедините прогнозы и добавьте наиболее достоверно прогнозируемые данные в помеченный набор данных.
  4. Повторяйте шаги с 1 по 3, пока не будет достигнута желаемая точность.

В обоих случаях модели, используемые для частично контролируемого обучения, могут быть любой моделью контролируемого обучения, такой как логистическая регрессия, дерево решений и т. д. Конкретная математическая формула для этих моделей будет зависеть от используемой модели.

Активное изучение

Активное обучение — это тип машинного обучения, который позволяет алгоритму активно выбирать данные, на которых он хочет учиться. При активном обучении алгоритм может запрашивать у пользователя-человека метки для конкретных экземпляров, чтобы повысить его производительность. Активное обучение особенно полезно в ситуациях, когда размеченных данных мало и их получение дорого. Активно выбирая экземпляры для обучения, алгоритм может повысить свою производительность с меньшим помеченным набором данных.

Использование активного обучения:

При обработке естественного языка, когда доступно большое количество текста, но помечена лишь небольшая его часть, можно использовать алгоритм активного обучения, чтобы запрашивать у пользователя-человека метки для конкретных экземпляров, чтобы повысить его производительность.< br /> В компьютерном зрении, когда доступен большой набор данных изображений, но помечена лишь небольшая их часть, можно использовать алгоритм активного обучения, чтобы запрашивать у пользователя-человека метки для конкретных экземпляров, чтобы повысить его производительность. .

Математические формулы
Алгоритмы активного обучения обычно включают комбинацию алгоритмов обучения с учителем и без учителя. Одним из самых популярных алгоритмов для решения этой проблемы является выборка по неопределенности. Процедура обучения для этого следующая:

  1. Обучите модель, используя помеченные данные
  2. Используйте обученную модель для прогнозирования меток на немаркированных данных.
  3. Выберите экземпляры с наивысшей оценкой неопределенности и запросите у пользователя-человека их метки.
  4. Добавьте новые помеченные экземпляры в помеченный набор данных.
  5. Повторяйте шаги с 1 по 4, пока не будет достигнута желаемая точность.

Здесь оценка неопределенности может быть рассчитана с использованием различных методов, таких как энтропия, запас и другие. Конкретная математическая формула для этих методов будет зависеть от используемого метода.

Другой алгоритм, который используется в активном обучении, — запрос по комитету. Он реализован следующим образом:

  1. Обучите несколько моделей, используя помеченные данные
  2. Используйте модели для прогнозирования меток на немаркированных данных.
  3. Выберите экземпляры, в которых модели не совпадают, и запросите у пользователя-человека их метки.
  4. Добавьте новые помеченные экземпляры в помеченный набор данных.
  5. Повторяйте шаги с 1 по 4, пока не будет достигнута желаемая точность.

В обоих случаях моделями, используемыми для активного обучения, могут быть любые модели обучения с учителем, такие как логистическая регрессия, дерево решений и т. д. Конкретная математическая формула для этих моделей будет зависеть от используемой модели.

Вы можете получить полный доступ ко всем историям на Medium менее чем за 1 доллар в неделю, зарегистрировавшись по этой ссылке.

Ресурсы:

  1. Что такое контролируемое обучение?
  2. Контролируемое и неконтролируемое обучение
  3. Объяснение обучения с подкреплением
  4. Что такое активное обучение и как оно работает
  5. Стратегии и меры активного обучения
  6. Объяснение полуконтролируемого обучения

Подпишитесь на DDIntel Здесь.

Посетите наш сайт здесь: https://www.datadriveninvestor.com

Присоединяйтесь к нашей сети здесь: https://datadriveninvestor.com/collaborate