Есть два источника ошибок, а именно смещение и отклонение, которые мешают любому алгоритму обобщать.

BIAS - Когда мы моделируем очень простым способом для новичков, например, прогнозируем только одно линейное уравнение для реальной сложной модели. Конечно, из-за этой модели модель становится неподходящей и упускает различные важные идеи и взаимосвязи между переменными.

ВАРИАНТНОСТЬ. С другой стороны, когда мы чрезмерно озабочены простыми заданными данными и подбираем модель очень сложным образом, это приводит к чрезмерной подгонке. Таким образом, каждый шум и выброс будет рассматриваться как действительная точка данных и соответственно моделироваться.

Когда мы хотим соответствовать любой модели, которую мы хотим: -

1.) Обобщите для любой новой точки данных, данной модели для прогнозирования. (Не в соответствие)

2.) Сделайте сложную, но простую модель.

ПРЕДВАРИТЕЛЬНАЯ ИНФОРМАЦИЯ: - Ожидание [прогнозируемая функция (x)] - Ожидание [фактическая функция (x)]

ВАРИАНТ: - Ожидание [прогнозируемая функция (x) ²] - Ожидание [фактическая функция (x)] ²

Ожидание [(фактический результат - прогнозируемый результат) ²] = (СДВИГ (прогнозируемый результат)) ² + VARIANCE (прогнозируемый результат) + дисперсия точек

Поскольку фактическая функция детерминирована.

Ожидание [фактическая функция (x)] = фактическая функция (x)

E[f(x)] = f(x)

E [фактический выход] = E [фактическая функция (x) - ошибка] = фактическая функция (x)

E[y] = E [f(x) — e] = f(x)

дисперсия [e] = σ²