В этой статье мы узнаем о том, что такое переобучение, недообучение и компромисс смещения.

Давайте возьмем пример класса средней школы, в котором есть 3 типа учеников.

Учащийся А – недостаточно подготовленный – учащийся в классе, который не понимает основных понятий, поэтому очевидно, что он не может сдать экзамен.

Учащийся B – переоснащение – учащийся класса, который выучил наизусть все понятия, но не понимает их до конца. На экзамене, если вопросы будут заданы немного иначе, он не сможет выполнить задание.

Студент C – лучший вариант – учащийся класса, который хорошо понимает концепции и может ответить на каверзные вопросы на экзамене.

В идеале, в машинном обучении нам нужна наша модель, которая точно фиксирует шаблон в своих обучающих данных, а также хорошо обобщает невидимые данные.

Теперь давайте разберемся, как переоснащение и недообучение связаны с предвзятостью и дисперсией.

1 – Предвзятость – высокий уклон означает недостаточное соответствие.

Смещение — это то, насколько далеки прогнозируемые значения от фактических значений. Смещение увеличивается, когда средние прогнозируемые значения далеки от фактических значений.

Если модель имеет большое смещение , это означает, что модель слишком проста и, следовательно, не фиксирует закономерности в обучающих данных. Эта ситуация не что иное, как недообучение.

2 – Дисперсия. Высокая дисперсия приводит к переоснащению.

Говорят, что модель имеет большую дисперсию, когда предсказание модели сильно меняется при небольшом изменении входных данных.

Модель с большей дисперсией уделяет большое внимание обучающим данным и плохо обобщает невидимые данные. Это похоже на студента, который запоминает все, не понимая концепций.

Смещение — компромисс дисперсии

Когда мы сталкиваемся с недообучением и переоснащением в нашей модели, нам нужно решить эту проблему, используя компромисс между смещением и дисперсией.

Мы хотим, чтобы наша модель имела низкое смещение и низкую дисперсию, чтобы уменьшить общую ошибку. Модель средней сложности с низкой ошибкой теста, что показано на изображении ниже.

высокое смещение, низкая дисперсия — это указывает на то, что модель слишком проста.

Низкое смещение, высокая дисперсия. Это указывает на то, что модель слишком сложна и не может работать с невидимыми данными.

Как определить, что модель имеет высокую дисперсию или большое смещение?

High Bias - это когда есть высокая ошибка обучения.

Высокая дисперсия — это высокая ошибка теста.

Как решить проблему высокого смещения?

. Дополнительные функции ввода

. Добавьте больше сложности, используя полиномиальные функции

. Уменьшить срок регуляризации.

Как решить проблему с высокой дисперсией?

.Используйте больше обучающих данных.

. Уменьшить входные функции

. Увеличить срок регуляризации.