Введение в машинное обучение

Введение
Прежде всего, в целом я должен упомянуть, что машинное обучение выросло из ранней работы в области ИИ (искусственного интеллекта). своего рода развитие новых возможностей для компьютеров, но, в частности, ясно, что есть много приложений, которые мы не можем запрограммировать вручную, например, извлечение символов из курсивного письма или управление вертолетом невозможно с помощью явного кодирования. Успешный подход заключается в использовании алгоритма обучения, чтобы заставить компьютеры учиться самостоятельно.

Алгоритм обучения простым словом
Все мы используем алгоритм обучения, не подозревая об этом. например, каждый раз, когда мы отправляем электронное письмо, выписываем чек, используем кредитные карты, совершаем покупку на веб-сайте и… мы используем такой алгоритм для выполнения действия.

Определение машинного обучения
Артур Самуэль (1959). (Неофициальное определение):
Область исследования, которая дает компьютерам возможность учиться без явного программирования.
он доказал это, написав программу для шашек, которая научилась играть намного лучше, чем он сам.

Том Митчелл (1988). (Формальное определение):
Говорят, что компьютерная программа учится на опыте E в отношении некоторой задачи T и некоторого показателя производительности P, если ее производительность на T, измеряемая P, улучшается с опытом E.

Обзор 4 основных концепций машинного обучения:
1 — контролируемое обучение
В этом подходе мы наблюдаем за алгоритмом, давая правильный ответ на него, чтобы узнать связь между входными данными. и вывод с существующим набором данных, чтобы делать прогнозы для новых данных.
давайте рассмотрим пример. Я хочу проверить цену моего дома. Во-первых, мне нужно подготовить набор данных из существующей цены дома и провести к нему прямую линию.

затем давайте найдем размер моего дома по оси X и предскажем цену, как показано ниже:

Обучение с учителем хорошо справляется с задачами регрессии и классификации.

Термин регрессия относится к тому факту, что переменная, которую вы пытаетесь предсказать, представляет собой непрерывное значение и цену.

В задаче классификации переменная, которую вы пытаетесь предсказать, является дискретной, а не непрерывной.

давайте рассмотрим пример. мы собираемся изучить алгоритм, чтобы предсказать, является ли определенная опухоль злокачественной. Это можно сделать по размеру опухоли. Переменная, которую вы пытаетесь предсказать, является дискретным значением. Это либо ноль, либо 1 по оси Y, поэтому ваш набор данных может выглядеть примерно так:

Что мы должны сделать, чтобы использовать более одной переменной, чтобы попытаться предсказать?
В случае пациентов разного возраста и с разным размером опухоли мы будем предсказывать, является ли опухоль злокачественной или доброкачественной, где плюс указывает на злокачественная опухоль, а «О» указывает на доброкачественную опухоль.

2- Теория обучения
Основная концепция теории заключается в том, как использовать инструменты машинного обучения и правильно их применять для создания правильного алгоритма обучения.

3-обучение без учителя
В отличие от обучения с учителем, мы не получим правильного ответа в наборе данных и просто должны найти интересную структуру через набор данных.
один из общих примеров , в этом случае, будет в рыночном сегменте. нам нужно распознать структуру в таких наборах данных путем кластеризации.

4-Reinforcement Learning
Этот тип обучения относится к проблемам, когда вы не принимаете однократных решений. Это означает, что вас обычно просят принять последовательность решений с течением времени.
Основная идея алгоритма обучения с подкреплением называется функцией вознаграждения, как при дрессировке собаки. Поэтому каждый раз, когда ваша собака делает что-то хорошее, вы говорите: «Хорошая собака», и вы вознаграждаете собаку, а также делаете это наоборот. Таким образом, со временем ваша собака научится делать правильные вещи, чтобы получать больше положительных вознаграждений.
Это делается точно так же, как и при обучении вертолета летать, и, конечно же, до алгоритма обучения, чтобы выяснить, как это сделать. максимизируйте хорошие сигналы вознаграждения и минимизируйте плохие сигналы вознаграждения.
Наконец, ясно, что обучение с подкреплением применяется ко многим проблемам в робототехнике.