Что такое полиномиальная регрессия?

В простом понимании: поли означает «много», а номинальный означает «термины» или «части».

В регрессионном анализе независимая переменная (X) и зависимая переменная (Y) моделируются как полином n-й степени. Другими словами, когда наши данные линейны, мы используем линейную регрессию, когда наши данные сложны для прямой линии, мы используем полиномиальную регрессию; кривая линии зависит от степени многочлена.

По мере того как степень полиномиального уравнения (n) становится выше, полиномиальное уравнение становится сложным, и существует вероятность того, что модель имеет тенденцию к переоснащению.

▪ ️Полиномиальная функция задается следующим образом:

𝑦̂ = 𝑎0 + 𝑎1𝑥1 + 𝑎2𝑥1^2 + ⋯ + 𝑎𝑛𝑥1^𝑛 + Гауссовский шум

x1 - это функция, и после возведения в квадрат, т.е. x1², становится новой функцией (столбцом). Это изменит распределение и разделит маленькие и большие значения, создав экспоненциальный график.

🔹Существуют типы регрессии, для понимания разницы между регрессиями упоминаются следующие.

▪️ Линейная регрессия → 𝑦 = 𝑎0 + 𝑎1x1

▪️ Множественная регрессия → 𝑦 = 𝑎0 + 𝑎1x1 + 𝑎2x2 + ⋯ + 𝑎𝑛x𝑛

▪️ Полиномиальная линейная регрессия → 𝑦 = 𝑎0 + 𝑎1x1 + 𝑎2x1² + ⋯ + 𝑎𝑋x1²

В машинном обучении необычно использовать степень выше 2 или 3, поскольку это может привести к чрезмерно гибким формам линий и созданию странных форм.

🔺Математическая часть.🔺

Значение равно B, т. е. коэффициенты определяются матричным методом исключения Гаусса.

Здесь Bo = ao, B1 = a1 и т. д.

🔹Пример с полиномом 5-й степени, чтобы понять, как решается полиномиальное уравнение.

Метод исключения Гаусса или редукции строк используется для решения системы линейных уравнений.

Эта ссылка поможет вам лучше понять метод исключения Гаусса с большим количеством примеров. http://mlwiki.org/index.php/Система_линейных_уравнений

Все значения x и y подставляются в уравнение, как указано ниже.

Мы будем рассматривать x и y как точки данных. (0,4), (1,6), (2,22), (3,70), соответственно и d = Bo, c = a1, b = a2, a=a3.

Во-первых, мы помещаем приведенные выше уравнения в матрицу.

После чего сводим строки к нулю, кроме диагональных значений в матрице, определяющих значения коэффициентов.

Цифры, обведенные рядом с матрицей, обозначают строку.

Как показано на изображении ниже.

Строки изменяются, чтобы получить единичную матрицу.

На изображении выше показана окончательная функция, полученная путем определения матрицы с использованием метода исключения Гаусса.

Поняв это уравнение, находится коэффициент многочлена.

Чтобы углубиться в более глубокую и разнообразную математику полиномиальной регрессии, перейдите по этой ссылке. http://polynomialregression.drque.net/math.html

После этого находим корни x и строим график.

p(x) = 3x³ + 2x² + x + 4

Мы находим Y-пересечение, подставляя 0 в x и решаем

p(0) = 3(0)³ +2(0)² + 0 + 4 = 0

Следовательно, Y= (0,4)

Для X-пересечения, чтобы найти корни X, мы должны подойти к Дискриминантному методу. Для метода см. https://www.wikihow.com/Solve-a-Cubic-Equation

Для каждого полиномиального уравнения существует свой метод нахождения корней x.

Для пересечения x мы имеем (0,0,83)

Это дает нам график пересечения по осям Y и X.

▪️ Понимание шагов, используемых для выполнения полиномиальной регрессии в python.

Импорт библиотек, набора данных и их визуализация.

Теперь мы извлекаем функции из набора данных, реализуя [: , 1 : -1], и извлекаем метки из набора данных, реализуя [: , -1].

Мы импортировали линейную регрессию, поскольку полиномиальная регрессия является частью линейной регрессии.

Визуализация с помощью линейной регрессии.

Функция fit() включает в себя нужную нам функцию, а функция transform() фактически преобразует ее, преобразуя одномерный массив в двумерный массив.

Визуализация с полиномиальной регрессией.

Для более плавной кривой.

Если вы хотите узнать больше о практическом примере, посетите: https://data36.com/polynomial-regression-python-scikit-learn/

Сотрясение

Эта статья должна была понять математику полиномиальной регрессии, где по нескольким точкам данных мы нашли значения коэффициентов, которые указывают ширину графика, а знак коэффициентов определяет направление.

Чем меньше коэффициент шире разрыва, и чем больше номер коэффициента, тем уже график.

На приведенном ниже графике коэффициент a положительный и большой. Поэтому парабола узкая и направлена ​​вверх.

На приведенном ниже графике коэффициент a меньше. Следовательно, парабола шире.

X-пересечение и Y-пересечение были определены для точек на оси x и оси y соответственно, из которых проходит кривая.