Когда мы говорим о машинном обучении, оно делится на два типа: Обучение с учителем и Обучение без учителя.
Обучение с учителем подразделяется на регрессию и Классификация

Теперь в нашем наборе данных всегда будет набор функций и меток, где функции — это независимая переменная, а метки — зависимая переменная.

Как в регрессии, так и в классификации у вас будут функции и метки,
но, когда дело доходит до типа данных, функции могут иметь любой тип данных в регрессии и классификации.
Но, когда дело доходит до ярлыков. В регрессии функции должны быть обязательно числовыми. Принимая во внимание, чтов классификации объекты должны быть категориальными, порядковыми или дискретными числовыми. Тогда вы будете строго использовать классификацию.

Давайте обсудим метод регрессии. Алгоритм, связанный с методом регрессии, таков:

  1. Линейная регрессия
    а. Простая линейная регрессия
    b. Множественная линейная регрессия
    c. Полиномиальная линейная регрессия
  2. Регрессия дерева решений
  3. Регрессия случайного леса
  4. Регрессия опорных векторов
  5. Регрессия xgboost

Теперь возникает вопрос, когда какую регрессию использовать?
Мы должны использовать всю регрессию и выбрать модель, которая дает наилучшую точность.

Линейная регрессия

Цель линейной регрессии — определить линию наилучшего соответствия.
наилучшее соответствие означает линию с меньшей ошибкой.

Где,
m = наклон линии
c = точка пересечения линии
x = объект
y = метка

а. Простая линейная регрессия

Простая линейная регрессия имеет одну функцию и одну метку.

Давайте рассмотрим пример многолетнего опыта в отношении его заработной платы
На приведенной выше диаграмме ось Y — это характеристика, а ось X — метка.
значение X, выделенное синим цветом, — это фактическое значение.
Красная точка на линии — это Прогнозируемое значение
Пунктирная линия — это ОШИБКА
Зеленая линия называется линия наилучшего соответствия

Как рассчитывается ошибка?

1. Средняя абсолютная ошибка

Чтобы определить, какая линия лучше всего подходит, у нас есть Error или Error Function
, чтобы проверить производительность модели, есть три функции
a. Функция потерь
б. Функция затрат
c. Функция ошибки

Ошибка – фактическое значение — прогнозируемое значение
| у2 — у1| } Чтобы узнать ошибку одиночного наблюдения, мы используем функцию потерь и функцию стоимости.

Для расчета погрешности всей линии или модели.
| Y факт — Y Пред | = потеря каждого очка

Чтобы рассчитать общую ошибку, обратитесь к рисунку ниже.

Средняя абсолютная ошибка — это ваша функция ошибки, она генерируется на основе функции потерь или стоимости. Таким образом, на диаграмме (c) выше функция потерь равна 3,1.

Итак, Ошибка модели 3,1/4 = 0,775.

2. Среднеквадратичная ошибка

Средняя абсолютная ошибка и СРЕДНЕКВАДРАТИЧЕСКАЯ ОШИБКА официально называются Функция ошибки, которую можно использовать для регрессии.

Какая из строк имеет меньшую ошибку, это будет наша линия наилучшего соответствия.
как показано на диаграмме выше, линия c является линией наилучшего соответствия, так как ошибка составляет 0,699.

Технически этот метод называется Градиентный спуск
Цель градиентного спуска — выбрать значение с меньшей ошибкой.
Определить оптимум спуска. где точка красного цвета оптимальна на изображении ниже.