Прежде чем переходить к смещению и отклонению, мы должны четко понять, что такое недостаточное и чрезмерное соответствие.

  • Недостаточная подгонка: здесь точки данных не попадают близко к кривой и дают большее значение общей ошибки для новых точек данных.
LOW TRAINING DATA ACCURACY
LOW TESTING DATA ACCURACY
  • Чрезмерная подгонка: это полная противоположность недоподгонки, когда все точки падают точно на кривую, в результате чего новые точки тестирования, подверженные большему количеству ошибок.
HIGH TRAINING DATA ACCURACY
LOW TESTING DATA ACCURACY

Теперь, когда мы знаем о недообучении и переобучении, давайте поговорим о смещении и отклонении.

  • Смещение: ошибка обучающих данных.
  • Разница: ошибка данных тестирования.

Hence,
We should always create a model with low bias and low variance, and just like that, only we can overcome the under-fitting and over-fitting problem.

Следующая статья расскажет о чем-то новом и интересном в области науки о данных 😉