Темы этой статьи:

  1. Что такое нейронная сеть?
  2. Типы нейронных сетей?
  3. Что такое ИНС и об ИНС?
  4. Что такое RNN и о RNN?
  5. Сравнение между RNN, MLP, CNN?

Теперь давайте перейдем к пояснительной части

Нейронная сеть — это группа/комбинация алгоритмов, которая помогает инженеру машинного обучения распознавать основные связи в наборе данных с помощью процесса, который работает так же, как человеческий мозг. Теперь, принимая этот смысл, нейронные сети относятся к системам нейронов, которые либо делятся на два случая: первый — органический, а другой — искусственный. Простая нейронная сеть состоит в основном из трех частей: первая (входной слой), вторая — выходной (или целевой) слой, а третья, которая остается между ними, — скрытый слой. Слои связаны через узлы, и эти соединения образуют «сеть» — нейронную сеть — взаимосвязанных узлов.

Нейронные сети в основном или в ядре создаются для того, чтобы работать так же, как обычный человеческий мозг в повседневной деятельности. Возьмем пример,В случае выяснения результата правильного почерка или распознавания владельца мозг обычно узнает ответ за очень несколько секунд. Например, в случае распознавания лиц мозг может начать с «Это женщина или мужчина? Он черный или белый? Он старый или молодой?

Теперь давайте перейдем ко второму пункту о типах нейронных сетей.

Вторая часть в основном посвящена трем важным типам нейронных сетей, которые формируют поддержку большинства предварительно обученных моделей в глубоком обучении:

Искусственные нейронные сети (ИНС)

Сверточные нейронные сети (CNN)

Рекуррентные нейронные сети (RNN)

Искусственная нейронная сеть (ИНС) — что такое ИНС и зачем ее использовать?

Один узел (нейрон) можно представить как логистическую регрессию. Искусственная нейронная сеть или ИНС представляет собой группу из нескольких узлов/нейронов в каждой точке/слое. ИНС также известна как нейронная сеть с прямой связью, поскольку входные данные выполняются в прямом направлении: как вы можете видеть здесь, ИНС состоит из 3 слоев — входного, скрытого и выходного. Входной слой принимает входные данные, скрытый слой обрабатывает входные данные, а выходной слой выдает результат. По сути, каждый слой пытается изучить определенные веса.

ИНС можно использовать для решения задач, связанных с:

  • данные в табличной форме
  • данные в образной/визуальной форме
  • данные в текстовом виде

Рекуррентная нейронная сеть (RNN) — что такое RNN и зачем ее использовать?

Давайте сначала попробуем понять разницу между RNN и ANN с архитектурной точки зрения.

Как вы можете видеть здесь, RNN имеет рекуррентную связь со скрытым состоянием. Это ограничение цикличности гарантирует, что во входных данных фиксируется последовательная информация.

Чтобы узнать больше о внутренней работе RNN (и о том, как создать ее на Python), вам следует изучить приведенный ниже учебник:

Мы можем использовать рекуррентные нейронные сети для решения проблем, связанных с:

  • Данные в формате временных рядов
  • Данные в текстовой форме
  • Данные в звуковой форме

RNN в основном фиксирует связанную информацию, присутствующую во входных данных, то есть зависимость между словами в тексте, делая прогнозы. Вывод на каждом временном шаге зависит не только от текущего слова, но и от предыдущих слов. RNN совместно используют параметры на многих разных временных шагах. Это широко известно как Общий доступ к параметрам. Это приводит к очень приятному преимуществу меньшего количества параметров для обучения, а также снижает стоимость обработки.

Глубокие RNN (RNN с большим количеством временных шагов) также страдают от (основной проблемы) проблемы исчезновения и взрыва градиента, которая является общей проблемой для всех различных типов нейронных сетей. Градиент, вычисленный на последнем временном шаге, исчезает, когда он достигает начального временного шага. Сверточные нейронные сети (CNN) — это все форматы в сообществе глубокого обучения прямо сейчас. Эти модели сверточных нейронных сетей (CNN) используются в различных приложениях и областях, и они особенно распространены в программном обеспечении для обработки изображений и видео. Стандартными блоками CNN являются фильтры, также известные как ядра. Ядра используются для извлечения соответствующих функций из входных данных с помощью операции свертки.

Сравнение различных типов нейронных сетей (MLP (ANN) против RNN против CNN)

Пожалуйста, ознакомьтесь с условиями, прежде чем перейти к следующему абзацу:

Рекуррентная сеть —› Рекуррентная сеть сочетает в себе обратную связь и прямую связь нейронных сетей. Другими словами, это просто нейронная сеть с петлями, соединяющими выходные ответы с входным слоем. Таким образом, выходные отклики сети функционируют как дополнительные входные переменные.

Совместное использование параметров –› Чтобы повторить совместное использование параметров, происходит, когда карта объектов создается в результате свертки между фильтром и входными данными из единицы внутри плоскости свертки. слой. Все единицы в этой плоскости слоя имеют одинаковый вес; следовательно, это называется разделением веса/параметра.

Пространственные отношения –› относятся к пониманию детьми того, как объекты и люди перемещаются друг относительно друга. В младенчестве дети используют свои чувства, чтобы наблюдать и получать информацию об объектах и ​​людях в их окружении. Они могут видеть и следить за людьми и предметами глазами. Пространственная информация относится к информации, имеющей связь на основе местоположения с другой информацией. Например, 00100. 01100

MLP в основном имеет табличные данные, не имеет повторяющихся соединений, не имеет совместного использования параметров, не имеет пространственных отношений и градиента исчезновения и взрыва.

RNN в основном работает с данными последовательности, то есть временными рядами, текстом, рекуррентными соединениями аудио, совместным использованием параметров и не имеет пространственных отношений, также в случае градиентов присутствует исчезновение и взрыв.

Теперь в случае самой мощной нейронной сети CNN в основном работает с данными изображения, не имеет повторяющихся соединений, имеет совместное использование параметров и имеет пространственные отношения. Теперь в случае с градиентом есть случай исчезновения и взрыва градиентов.