Я работаю над WGAN и хочу внедрить WGAN-GP.
В своей исходной статье WGAN-GP реализована со штрафом за градиент из-за ограничения 1-Lipschitiz. Но такие пакеты, как Keras, могут обрезать норму градиента до 1 (что по определению эквивалентно ограничению 1-Lipschitiz), так почему мы утруждаемся наказанием за градиент? Почему бы нам просто не обрезать градиент?