Внезапное падение validation_loss после перезагрузки модели (ей)

Я тестирую cGAN в keras / tensorflow, и через 1000 эпох я сохранил модель.

Через некоторое время я восстановил

модель генератора + веса
модель дискриминатора + веса
грузы GAN (модель воссоздана)

Это результирующая val_accuracy:

Можно ясно видеть, что после восстановления модели происходит огромное падение val_loss.

Может ли кто-нибудь объяснить мне, почему / что могло вызвать эту ситуацию?

Stormsson 10.07.2018 источник

comment

Если вы использовали оптимизатор с адаптивной скоростью обучения, то довольно часто такое случается. Скорость обучения, вероятно, снизилась около 1000-й эпохи, и в результате это помогло тренировочному процессу избежать плато / прыжков вокруг локальных минимумов. - today 10.07.2018

comment

не уверен в этом: событие в 1000-й эпохе было перезапуском машины. Казалось бы, после перезагрузки модели что-то изменилось, но я не понимаю что, потому что я сохранил и восстановил все веса. Единственным отличием было состояние оптимизатора в GAN; может это быть причиной? - Stormsson 10.07.2018

comment

Я думаю, что состояние оптимизатора также сохраняется, когда вы сохраняете модель Keras, и изменение скорости обучения, как я уже сказал, является одним из возможных объяснений. Но, если вы изменили оптимизатор или его параметры после загрузки модели, то это тоже могло быть причиной. - today 10.07.2018

comment

Графика показывает потерю валидации, не точность валидации, не так ли? - critop 10.07.2018

comment

@critop я подтверждаю, что это потеря валидации - Stormsson 11.07.2018

comment

В первый раз, когда я увидел это, я делал новый train / val, таким образом загрязняя свой набор данных val. - grabbag 22.08.2020

Ответы (1)

arrow_upward
2
arrow_downward

Для подтверждения этого может потребоваться дальнейший анализ, но вы могли случайно обнаружить метод под названием "теплый перезапуск". Проще говоря, вы тренируете свою модель с помощью отжига в обычном режиме, останавливаетесь, сбрасываете скорость обучения и начинаете заново. Интуитивно вы даете модели возможность выпрыгнуть из локальных минимумов, и это может привести к наблюдаемому поведению.

critop 10.07.2018

comment

я считаю, что это могло случиться; после перезагрузки модели LR было на начальном значении - Stormsson; 11.07.2018

comment

Может быть, вы первый, кто на самом деле попробовал это с помощью GAN. Это требует бумаги (-; - critop; 11.07.2018

comment

Val_loss также может увеличиваться после перезагрузки весов модели и перезапуска обучения по той же причине. Это может быть особенно проблематичным, поскольку порог контрольной точки также сбрасывается на Inf, перезаписывая предыдущие лучшие веса с резко худшими весами. - user3673; 02.01.2020

Внезапное падение validation_loss после перезагрузки модели (ей)

Ответы (1)

Вопросы по теме