Интуитивное объяснение компромисса с отклонением от смещения

Мне всегда было трудно вспомнить, что на самом деле означает этот термин. Куда бы я ни пошел, я встречал только одно определение: Высокое смещение означает недостаточное соответствие, а высокое отклонение означает чрезмерное соответствие. Поскольку это очень важная концепция при принятии решения, какой алгоритм выбрать для вашей проблемы, а также помогает Настройте свой алгоритм правильно, я решил дать интуитивное объяснение этой концепции.

Смещение и отклонение в реальном мире

В словарных терминах:

Предубеждение: предубеждение в пользу или против одного предмета, человека или группы по сравнению с другим, обычно считающееся несправедливым.

Дисперсия: состояние или факт несогласия или ссоры.

Короче говоря, предвзятость показывает, насколько что-то несправедливо по отношению к другим, а отклонение - насколько вероятно, что что-то изменится по отношению к другим.

Непонятно? Не волнуйся. Этот пример прояснит все ваши сомнения.

Предположим, вы вызвали двух экспертов по погоде, г-на Бишопа и г-на Вариана, чтобы проверить, пойдет ли дождь или нет.

Мистер Бишоп очень любит дождь. А мистер Вариан - книжный червь.

Давайте поговорим о трех условиях. Дождь идет, только если немного влажно, и не идет, если ветрено, жарко или морозно.

Вы спрашиваете мистера Бишопа (Несмотря на его подготовку, он слишком предвзято относится к дождю):

Я: Сэр, здесь очень жарко, будет дождь?
Мистер Бишоп: Ага.

Я: Сэр, немного ветрено, будет дождь?
Мистер Бишоп: Может и нет.

Я: Сэр, будет мороз, пойдет дождь?
Мистер Бишоп: Да, конечно.

Я: Сэр, немного влажно, будет дождь?
Мистер Бишоп: Черт возьми.

Вы обратили внимание, мистер Бишоп очень предвзят в отношении вероятности дождя. Во время теста он не может правильно предсказать большинство из них.

Это состояние называется подгонкой.

Теперь давайте посмотрим на ваш разговор с г-ном Варианом (книжным червем, который полностью помнит свое обучение):

Я: Сэр, здесь очень жарко, будет дождь?
Мистер Вариан: Нет.

Я: Сэр, немного ветрено, будет дождь?
Мистер Вариан: Ни за что.

Я: Сэр, холодно, будет дождь?
Мистер Вариан: Ни за что.

Я: Сэр, немного влажно, будет ли дождь?
Мистер Вариан: Да будет.

Мистер Вариан успешно предсказал, пойдет дождь или нет. Но, будучи книжным червем, мистер Вариан не знает условий, не описанных в книге, во время обучения.

Теперь мы спрашиваем г-на Вариана:

Я: Сэр, на облаке сидит гигант, потерявший свою конфету. Будет ли дождь?
Г-н Вариан: Не уверен, так как ответ на большинство условий отрицательный, высока вероятность, что дождя не будет.

Теперь, хотя решение г-на Вариана полностью зависит от входных условий, он не может предсказать новое и невидимое условие (другие общие условия, кроме данных конкретных условий во время тренировки).

Это состояние называется переобучением. И он предлагает плохую обобщаемость.

Тогда что лучше: высокая систематическая ошибка (высокая обобщаемость) или высокая дисперсия (высокая точность обучающих данных)?

Что ж, ответ: «Лучшее из обоих миров». Нам не нужны ни высокая систематическая ошибка, ни высокая дисперсия. Мы хотели бы, чтобы наш алгоритм работал лучше на обучающем наборе, а также предлагал лучший результат на невидимых данных (на тестовом наборе).

В общем, наличие высокого смещения снижает производительность алгоритма на обучающем наборе, в то время как высокая дисперсия снижает производительность на невидимых данных.

Это известно как компромисс отклонения смещения.

В моем следующем рассказе мы поговорим о том, как настроить алгоритм, страдающий от высокой систематической ошибки или высокой дисперсии, и как правильно подобрать ваш алгоритм.