Это будет короткий 1-минутный пост с моими мыслями о том, что мы не должны использовать следующее изображение при объяснении или изучении компромисса смещения и дисперсии.

Недавно во время чтения лекций в Университете Миддлсекс в Дубае мне задали вопрос о компромиссе смещения и дисперсии. Один из студентов не совсем понял, как перейти от картинки А к картинке Б:

Он пытался понять концепцию, читая несколько руководств и видео. Он видел 4-прицельную картинку почти в каждом посте, но запутался. Ему не только было трудно понять, как 4 сценария на картинке А превращаются в 3 сценария на картинке Б, но он также не нашел ни одного примера моделей с высоким смещением — высокой дисперсией. Честно говоря, мне потребовалось некоторое время, чтобы придумать такой пример (хочу услышать ваши мысли в комментариях, чтобы не портить свои идеи), чтобы объяснить концепцию на практических примерах.

Я искренне считаю, что пришло время прекратить использовать изображение с четырьмя мишенями. Если вы считаете, что цели — лучший способ объяснить предвзятость и дисперсию, рассмотрите возможность использования следующей диаграммы Венна слева.

Как вы могли заметить, при таком подходе становится намного проще отображать объяснения с низкой дисперсией и смещением с помощью графиков недостаточного соответствия-сладкого-переобучения:

Я не дизайнер, так что есть еще много улучшений, которые можно сделать. Но с концептуальной точки зрения, я думаю, это была иллюстрация того, что идея компромисса смещения и дисперсии более проста. Самое главное, это дало студенту более четкое представление о теме БВТ.