В своих предыдущих постах я рассмотрел простую линейную регрессию, а также множественную линейную регрессию. В этом посте я демонстрирую, как полиномиальная регрессия может помочь определить, существует ли связь между количеством рюмок водки и количеством чаевых в баре.

Что такое полиномиальная регрессия?

В статистике полиномиальная регрессия - это форма регрессионного анализа, в котором связь между независимой переменной x и зависимой переменной y моделируется как полином n-й степени в x.

- https://en.wikipedia.org/wiki/Polynomial_regression

Формула

Когда использовать полиномиальную регрессию?
Полиномиальную регрессию следует использовать, когда наши данные не вписываются в линейную модель.

Например, это полезно при описании распространения болезни или любых данных, нелинейных с экспоненциальным ростом. Ниже приведен пример того, как будет выглядеть такой набор данных:

Как видите, линейная модель не работает, поскольку наши данные нелинейны.

Набор данных

А теперь давайте посмотрим, действительно ли пьяные люди любят пить.

Давайте попробуем визуализировать наш набор данных с помощью линейной модели, так как вы можете видеть, что предсказание подсказки после 7,5 выстрелов даст нам гораздо большее число.

Давайте визуализируем наши данные с помощью нашей модели полиномиального регрессора. Если бы нам нужно было предсказать какое-либо значение, мы увидим, что наш совет будет более точным.

R Пример:
Вот код, который я использовал для создания своих моделей.

Резюме

Мы строим модели машинного обучения, чтобы прогнозировать будущую стоимость на основе исторических данных. В этом примере мы использовали как линейную, так и нелинейную модели, чтобы предсказать размер чаевых, которые дает человек после 7,5 выстрелов. График линейной модели предсказывает, что сумма чаевых будет примерно 37,5 по сравнению с полиномиальным графиком, который предсказывает, что сумма чаевых будет примерно 20.

Используя приведенный выше код, я запустил модель NumberOfShots, равную 7,5, и получил сумму чаевых 37,9 (линейная) против 20,3 (полиномиальная). Итак, мы видим, что наша полиномиальная модель намного точнее.

Надеюсь, вам понравился этот пост, прокомментируйте, если у вас есть какие-либо вопросы, и нажмите кнопку с застежками, чтобы больше людей могли им насладиться.

Подробнее на моем сайте.