Публикации по теме 'vanishing-gradient'


Проблема исчезающих градиентов
Исчезающие градиенты возникают при обучении глубоких нейронных сетей с использованием методов оптимизации на основе градиентов. Это происходит из-за природы алгоритма обратного распространения ошибки, который используется для обучения нейронной сети. О чем будет рассказано в этом блоге? Объясните проблему исчезающих градиентов: Мы поймем, почему существует проблема исчезающих градиентов. Мы также рассмотрим, почему эта проблема чаще наблюдается при использовании сигмовидной функции..