Предвзятость и дисперсия в машинном обучении

Прежде чем переходить к смещению и отклонению, мы должны четко понять, что такое недостаточное и чрезмерное соответствие.

Недостаточная подгонка: здесь точки данных не попадают близко к кривой и дают большее значение общей ошибки для новых точек данных.

LOW TRAINING DATA ACCURACY
LOW TESTING DATA ACCURACY

Чрезмерная подгонка: это полная противоположность недоподгонки, когда все точки падают точно на кривую, в результате чего новые точки тестирования, подверженные большему количеству ошибок.

HIGH TRAINING DATA ACCURACY
LOW TESTING DATA ACCURACY

Теперь, когда мы знаем о недообучении и переобучении, давайте поговорим о смещении и отклонении.

Смещение: ошибка обучающих данных.
Разница: ошибка данных тестирования.

Hence,
We should always create a model with low bias and low variance, and just like that, only we can overcome the under-fitting and over-fitting problem.

Следующая статья расскажет о чем-то новом и интересном в области науки о данных 😉

Предвзятость и дисперсия в машинном обучении

Вопросы по теме