Что такое полиномиальная регрессия?
В простом понимании: поли означает «много», а номинальный означает «термины» или «части».
В регрессионном анализе независимая переменная (X) и зависимая переменная (Y) моделируются как полином n-й степени. Другими словами, когда наши данные линейны, мы используем линейную регрессию, когда наши данные сложны для прямой линии, мы используем полиномиальную регрессию; кривая линии зависит от степени многочлена.
По мере того как степень полиномиального уравнения (n) становится выше, полиномиальное уравнение становится сложным, и существует вероятность того, что модель имеет тенденцию к переоснащению.
▪ ️Полиномиальная функция задается следующим образом:
𝑦̂ = 𝑎0 + 𝑎1𝑥1 + 𝑎2𝑥1^2 + ⋯ + 𝑎𝑛𝑥1^𝑛 + Гауссовский шум
x1 - это функция, и после возведения в квадрат, т.е. x1², становится новой функцией (столбцом). Это изменит распределение и разделит маленькие и большие значения, создав экспоненциальный график.
🔹Существуют типы регрессии, для понимания разницы между регрессиями упоминаются следующие.
▪️ Линейная регрессия → 𝑦 = 𝑎0 + 𝑎1x1
▪️ Множественная регрессия → 𝑦 = 𝑎0 + 𝑎1x1 + 𝑎2x2 + ⋯ + 𝑎𝑛x𝑛
▪️ Полиномиальная линейная регрессия → 𝑦 = 𝑎0 + 𝑎1x1 + 𝑎2x1² + ⋯ + 𝑎𝑋x1²
В машинном обучении необычно использовать степень выше 2 или 3, поскольку это может привести к чрезмерно гибким формам линий и созданию странных форм.
🔺Математическая часть.🔺
Значение равно B, т. е. коэффициенты определяются матричным методом исключения Гаусса.
Здесь Bo = ao, B1 = a1 и т. д.
🔹Пример с полиномом 5-й степени, чтобы понять, как решается полиномиальное уравнение.
Метод исключения Гаусса или редукции строк используется для решения системы линейных уравнений.
Эта ссылка поможет вам лучше понять метод исключения Гаусса с большим количеством примеров. http://mlwiki.org/index.php/Система_линейных_уравнений
Все значения x и y подставляются в уравнение, как указано ниже.
Мы будем рассматривать x и y как точки данных. (0,4), (1,6), (2,22), (3,70), соответственно и d = Bo, c = a1, b = a2, a=a3.
Во-первых, мы помещаем приведенные выше уравнения в матрицу.
После чего сводим строки к нулю, кроме диагональных значений в матрице, определяющих значения коэффициентов.
Цифры, обведенные рядом с матрицей, обозначают строку.
Как показано на изображении ниже.
Строки изменяются, чтобы получить единичную матрицу.
На изображении выше показана окончательная функция, полученная путем определения матрицы с использованием метода исключения Гаусса.
Поняв это уравнение, находится коэффициент многочлена.
Чтобы углубиться в более глубокую и разнообразную математику полиномиальной регрессии, перейдите по этой ссылке. http://polynomialregression.drque.net/math.html
После этого находим корни x и строим график.
p(x) = 3x³ + 2x² + x + 4
Мы находим Y-пересечение, подставляя 0 в x и решаем
p(0) = 3(0)³ +2(0)² + 0 + 4 = 0
Следовательно, Y= (0,4)
Для X-пересечения, чтобы найти корни X, мы должны подойти к Дискриминантному методу. Для метода см. https://www.wikihow.com/Solve-a-Cubic-Equation
Для каждого полиномиального уравнения существует свой метод нахождения корней x.
Для пересечения x мы имеем (0,0,83)
Это дает нам график пересечения по осям Y и X.
▪️ Понимание шагов, используемых для выполнения полиномиальной регрессии в python.
Импорт библиотек, набора данных и их визуализация.
Теперь мы извлекаем функции из набора данных, реализуя [: , 1 : -1], и извлекаем метки из набора данных, реализуя [: , -1].
Мы импортировали линейную регрессию, поскольку полиномиальная регрессия является частью линейной регрессии.
Визуализация с помощью линейной регрессии.
Функция fit() включает в себя нужную нам функцию, а функция transform() фактически преобразует ее, преобразуя одномерный массив в двумерный массив.
Визуализация с полиномиальной регрессией.
Для более плавной кривой.
Если вы хотите узнать больше о практическом примере, посетите: https://data36.com/polynomial-regression-python-scikit-learn/
Сотрясение
Эта статья должна была понять математику полиномиальной регрессии, где по нескольким точкам данных мы нашли значения коэффициентов, которые указывают ширину графика, а знак коэффициентов определяет направление.
Чем меньше коэффициент шире разрыва, и чем больше номер коэффициента, тем уже график.
На приведенном ниже графике коэффициент a положительный и большой. Поэтому парабола узкая и направлена вверх.
На приведенном ниже графике коэффициент a меньше. Следовательно, парабола шире.
X-пересечение и Y-пересечение были определены для точек на оси x и оси y соответственно, из которых проходит кривая.