В этой статье мы показываем, что проблема полиномиальной регрессии заключается не в чрезмерной подгонке, а в числовой точности. Даже если все сделано правильно, числовая точность по-прежнему остается непреодолимой проблемой. Здесь мы сосредоточимся на пошаговой полиномиальной регрессии, которая должна быть более стабильной, чем традиционная модель. В пошаговой регрессии мы оцениваем один коэффициент за раз, используя классический метод наименьших квадратов.
Даже если оцениваемая функция очень гладкая, из-за машинной точности можно точно вычислить только первые три или четыре коэффициента. С бесконечной точностью все коэффициенты будут вычислены правильно без переобучения. Сначала мы исследуем эту проблему с математической точки зрения в следующем разделе, а затем предоставим рекомендации по практической реализации модели в последнем разделе.
Это также полезно для профессионалов с математическим образованием, заинтересованных в том, чтобы узнать больше о науке о данных, поскольку мы начинаем с простой математики, а затем обсуждаем, как она связана с наукой о данных. Кроме того, это оригинальная статья, а не то, что вы будете изучать на занятиях в колледже или в лагерях данных, и в ней даже представлено решение линейной регрессии с бесконечным числом переменных.
Содержание этой статьи:
1. Полиномиальная регрессия для ряда Тейлора
- Ступенчатая полиномиальная регрессия: алгоритм
- Теорема сходимости
2. Применение к регрессионным моделям реальной жизни
- Рекомендации по практической реализации модели
Читай полную статью здесь".