Есть два источника ошибок, а именно смещение и отклонение, которые мешают любому алгоритму обобщать.
BIAS - Когда мы моделируем очень простым способом для новичков, например, прогнозируем только одно линейное уравнение для реальной сложной модели. Конечно, из-за этой модели модель становится неподходящей и упускает различные важные идеи и взаимосвязи между переменными.
ВАРИАНТНОСТЬ. С другой стороны, когда мы чрезмерно озабочены простыми заданными данными и подбираем модель очень сложным образом, это приводит к чрезмерной подгонке. Таким образом, каждый шум и выброс будет рассматриваться как действительная точка данных и соответственно моделироваться.
Когда мы хотим соответствовать любой модели, которую мы хотим: -
1.) Обобщите для любой новой точки данных, данной модели для прогнозирования. (Не в соответствие)
2.) Сделайте сложную, но простую модель.
ПРЕДВАРИТЕЛЬНАЯ ИНФОРМАЦИЯ: - Ожидание [прогнозируемая функция (x)] - Ожидание [фактическая функция (x)]
ВАРИАНТ: - Ожидание [прогнозируемая функция (x) ²] - Ожидание [фактическая функция (x)] ²
Ожидание [(фактический результат - прогнозируемый результат) ²] = (СДВИГ (прогнозируемый результат)) ² + VARIANCE (прогнозируемый результат) + дисперсия точек
Поскольку фактическая функция детерминирована.
Ожидание [фактическая функция (x)] = фактическая функция (x)
E[f(x)] = f(x)
E [фактический выход] = E [фактическая функция (x) - ошибка] = фактическая функция (x)
E[y] = E [f(x) — e] = f(x)
дисперсия [e] = σ²