В этой статье мы показываем, что проблема полиномиальной регрессии заключается не в чрезмерной подгонке, а в числовой точности. Даже если все сделано правильно, числовая точность по-прежнему остается непреодолимой проблемой. Здесь мы сосредоточимся на пошаговой полиномиальной регрессии, которая должна быть более стабильной, чем традиционная модель. В пошаговой регрессии мы оцениваем один коэффициент за раз, используя классический метод наименьших квадратов.

Даже если оцениваемая функция очень гладкая, из-за машинной точности можно точно вычислить только первые три или четыре коэффициента. С бесконечной точностью все коэффициенты будут вычислены правильно без переобучения. Сначала мы исследуем эту проблему с математической точки зрения в следующем разделе, а затем предоставим рекомендации по практической реализации модели в последнем разделе.

Это также полезно для профессионалов с математическим образованием, заинтересованных в том, чтобы узнать больше о науке о данных, поскольку мы начинаем с простой математики, а затем обсуждаем, как она связана с наукой о данных. Кроме того, это оригинальная статья, а не то, что вы будете изучать на занятиях в колледже или в лагерях данных, и в ней даже представлено решение линейной регрессии с бесконечным числом переменных.

Содержание этой статьи:

1. Полиномиальная регрессия для ряда Тейлора

  • Ступенчатая полиномиальная регрессия: алгоритм
  • Теорема сходимости

2. Применение к регрессионным моделям реальной жизни

  • Рекомендации по практической реализации модели

Читай полную статью здесь".