Публикации по теме 'backpropagation'
Обратное распространение! Распространение информации обратно к вам!
Обратное распространение! Распространение информации обратно к вам!
Чтобы открыть мистический черный ящик обратного распространения ошибки для новых энтузиастов машинного обучения, я создал эту короткую аналогию.
Если использовать повседневную аналогию, мы рассмотрим приготовление вашей любимой еды!!
Чтобы приготовить любимую еду, вам понадобятся ингредиенты. Чтобы получить/купить ингредиенты, вам понадобятся деньги. Сумма денег, которую вы готовы потратить (бюджет), влияет на..
Обратная интуиция
Точно так же, как HTML является базовым языком для изучения веб-разработки, обратное распространение также является основным алгоритмом для изучения глубокого обучения.
Одна из лучших интуиций для изучения алгоритма обратного распространения выглядит следующим образом:
Представьте, что вы находитесь в экзаменационном зале, и ситуация такова, что вы не отработали некоторые понятия, которые преподавались в классе. К счастью, вам удается тайно спросить окончательный ответ на вопрос у вашего..
Вывод обратного распространения с помощью кросс-энтропии.
Чтобы понять алгоритм обратного распространения, нам сначала необходимо понять некоторые основные концепции, такие как частичные производные, цепное правило, потеря кросс-энтропии, сигмоидальная функция и функция Softmax.
Предполагая, что мы уже передали входы, чтобы получить некоторые выходы на последнем слое Y, нам нужно будет вычислить функцию потерь E и распространить потери на все предыдущие слои, изменив веса, связанные с каждым из слоев.
Зная кросс-энтропийную потерю E и..
Обратное распространение нейронных сетей с нуля!
На создание этой статьи меня вдохновил Андрей Карпати . Я настоятельно рекомендую просмотреть приведенный ниже плейлист.
Так как это самое пошаговое объяснение Back Propagation и обучения нейронных сетей.
Обратное распространение:
Это метод расчета градиента функции потерь по отношению к весам нейронной сети. Обратное распространение – это способ вычисления градиентов выражений посредством рекурсивного применения цепного правила . Что оно делает ? Он используется для точной..
Что такое нейронная сеть?
Введение
Привет всем, сегодня я хочу объяснить, что такое нейронная сеть (NN), основная причина в том, что многие люди слушают о NN, но не знают, что это такое, как он работает и его назначение. Это история для таких людей или для новичков в этой области ИИ, которые сомневаются в концепции НС.
Нейронная сеть — это структура, которая пытается смоделировать биологическую структуру нейронов и их назначение, получить информацию о стимуле (получить данные в случае NN), передать эту информацию..
Как работают нейронные сети?
Поскольку нейронные сети меняют мир, я подумал, что было бы неплохо начать изучать их и рассказывать другим об этих влиятельных системах.
В этой статье вы узнаете:
Как нейронные сети могут делать прогнозы с помощью метода прямой подачи Важность функции потерь Как нейронные сети учатся через обратное распространение Как закодировать как метод прямой подачи, так и метод обратного распространения в Python, используя базовый пример
Чтобы получить базовое представление о математике,..
Обратное распространение и проблема исчезающего градиента в RNN (часть 2)
Как это уменьшается в LSTM
В части 1 этой серии мы рассмотрели обратное распространение в модели RNN и объяснили как формулами, так и численно показали проблему исчезающего градиента в RNN. В этой статье мы собираемся объяснить, как мы можем частично решить проблему исчезающего градиента с помощью LSTM, даже если он не исчезает полностью и с очень длинными последовательностями проблема все еще сохраняется.
Мотивация
Как мы видели в части 1 этой серии, ванильная RNN хранит..