Переобучение и недообучивание. [Пример ELI5]

С нулевой математикой! Да!

Сценарий:

В классе 5-А в школе KNN учится 3 ученика, и завтра предстоит контрольная по математике.

Тест проводится по таблицам умножения, и все они снабжены таблицей умножения до 10-й таблицы.

Ученик 1 решил запомнить все в совершенстве, не понимая, как работает умножение.

Учащийся 2изучил только первую строку таблиц, и у него не было достаточно времени, чтобы полностью понять таблицы.

Ученик 3 понял концепцию умножения и полностью изучил таблицы.

В день тестирования:

Был задан вопрос,

Что такое 13*11?

Ученик 1 не запомнил 13-ю таблицу и не понимает, как работает умножение, поэтому написал неправильный ответ.

Ученик 2 вообще не учился, поэтому он ответил 4 , потому что это все, что он знает.

Ученик 3 знал, как работает умножение, и написал правильный ответ по таблицам, которые использовал для обучения.

Здесь поведение каждого ученика объясняет конкретный тип примерки.

Наиболее подходящая модель

Наилучшая модель — это модель, которая берет обучающий набор данных и понимает, что происходит.

Должен быть готов ответить на вопросы, которых модель еще не видела, например Студент 3.

Переоснащение

Модель наложения ведет себя точно так же, как Student 1.

Подумайте об этом так.

Модель переобучения берет обучающий набор данных и полностью его запоминает, поэтому всякий раз, когда ей задают новый вопрос, она ищет этот вопрос в своих запомненных данных и дает ответ, который был дан ранее.

На любой вопрос, который модель раньше не видела, она, скорее всего, не даст правильного ответа.

Недооснащение

Это происходит, когда модель не может точно уловить то, что от нее требуется, генерируя неправильный результат независимо от того, какой вопрос задан.

Именно это и сделал Студент 2.