Темы этой статьи:
- Что такое нейронная сеть?
- Типы нейронных сетей?
- Что такое ИНС и об ИНС?
- Что такое RNN и о RNN?
- Сравнение между RNN, MLP, CNN?
Теперь давайте перейдем к пояснительной части
Нейронная сеть — это группа/комбинация алгоритмов, которая помогает инженеру машинного обучения распознавать основные связи в наборе данных с помощью процесса, который работает так же, как человеческий мозг. Теперь, принимая этот смысл, нейронные сети относятся к системам нейронов, которые либо делятся на два случая: первый — органический, а другой — искусственный. Простая нейронная сеть состоит в основном из трех частей: первая (входной слой), вторая — выходной (или целевой) слой, а третья, которая остается между ними, — скрытый слой. Слои связаны через узлы, и эти соединения образуют «сеть» — нейронную сеть — взаимосвязанных узлов.
Нейронные сети в основном или в ядре создаются для того, чтобы работать так же, как обычный человеческий мозг в повседневной деятельности. Возьмем пример,В случае выяснения результата правильного почерка или распознавания владельца мозг обычно узнает ответ за очень несколько секунд. Например, в случае распознавания лиц мозг может начать с «Это женщина или мужчина? Он черный или белый? Он старый или молодой?
Теперь давайте перейдем ко второму пункту о типах нейронных сетей.
Вторая часть в основном посвящена трем важным типам нейронных сетей, которые формируют поддержку большинства предварительно обученных моделей в глубоком обучении:
Искусственные нейронные сети (ИНС)
Сверточные нейронные сети (CNN)
Рекуррентные нейронные сети (RNN)
Искусственная нейронная сеть (ИНС) — что такое ИНС и зачем ее использовать?
Один узел (нейрон) можно представить как логистическую регрессию. Искусственная нейронная сеть или ИНС представляет собой группу из нескольких узлов/нейронов в каждой точке/слое. ИНС также известна как нейронная сеть с прямой связью, поскольку входные данные выполняются в прямом направлении: как вы можете видеть здесь, ИНС состоит из 3 слоев — входного, скрытого и выходного. Входной слой принимает входные данные, скрытый слой обрабатывает входные данные, а выходной слой выдает результат. По сути, каждый слой пытается изучить определенные веса.
ИНС можно использовать для решения задач, связанных с:
- данные в табличной форме
- данные в образной/визуальной форме
- данные в текстовом виде
Рекуррентная нейронная сеть (RNN) — что такое RNN и зачем ее использовать?
Давайте сначала попробуем понять разницу между RNN и ANN с архитектурной точки зрения.
Как вы можете видеть здесь, RNN имеет рекуррентную связь со скрытым состоянием. Это ограничение цикличности гарантирует, что во входных данных фиксируется последовательная информация.
Чтобы узнать больше о внутренней работе RNN (и о том, как создать ее на Python), вам следует изучить приведенный ниже учебник:
Мы можем использовать рекуррентные нейронные сети для решения проблем, связанных с:
- Данные в формате временных рядов
- Данные в текстовой форме
- Данные в звуковой форме
RNN в основном фиксирует связанную информацию, присутствующую во входных данных, то есть зависимость между словами в тексте, делая прогнозы. Вывод на каждом временном шаге зависит не только от текущего слова, но и от предыдущих слов. RNN совместно используют параметры на многих разных временных шагах. Это широко известно как Общий доступ к параметрам. Это приводит к очень приятному преимуществу меньшего количества параметров для обучения, а также снижает стоимость обработки.
Глубокие RNN (RNN с большим количеством временных шагов) также страдают от (основной проблемы) проблемы исчезновения и взрыва градиента, которая является общей проблемой для всех различных типов нейронных сетей. Градиент, вычисленный на последнем временном шаге, исчезает, когда он достигает начального временного шага. Сверточные нейронные сети (CNN) — это все форматы в сообществе глубокого обучения прямо сейчас. Эти модели сверточных нейронных сетей (CNN) используются в различных приложениях и областях, и они особенно распространены в программном обеспечении для обработки изображений и видео. Стандартными блоками CNN являются фильтры, также известные как ядра. Ядра используются для извлечения соответствующих функций из входных данных с помощью операции свертки.
Сравнение различных типов нейронных сетей (MLP (ANN) против RNN против CNN)
Пожалуйста, ознакомьтесь с условиями, прежде чем перейти к следующему абзацу:
Рекуррентная сеть —› Рекуррентная сеть сочетает в себе обратную связь и прямую связь нейронных сетей. Другими словами, это просто нейронная сеть с петлями, соединяющими выходные ответы с входным слоем. Таким образом, выходные отклики сети функционируют как дополнительные входные переменные.
Совместное использование параметров –› Чтобы повторить совместное использование параметров, происходит, когда карта объектов создается в результате свертки между фильтром и входными данными из единицы внутри плоскости свертки. слой. Все единицы в этой плоскости слоя имеют одинаковый вес; следовательно, это называется разделением веса/параметра.
Пространственные отношения –› относятся к пониманию детьми того, как объекты и люди перемещаются друг относительно друга. В младенчестве дети используют свои чувства, чтобы наблюдать и получать информацию об объектах и людях в их окружении. Они могут видеть и следить за людьми и предметами глазами. Пространственная информация относится к информации, имеющей связь на основе местоположения с другой информацией. Например, 00100. 01100
MLP в основном имеет табличные данные, не имеет повторяющихся соединений, не имеет совместного использования параметров, не имеет пространственных отношений и градиента исчезновения и взрыва.
RNN в основном работает с данными последовательности, то есть временными рядами, текстом, рекуррентными соединениями аудио, совместным использованием параметров и не имеет пространственных отношений, также в случае градиентов присутствует исчезновение и взрыв.
Теперь в случае самой мощной нейронной сети CNN в основном работает с данными изображения, не имеет повторяющихся соединений, имеет совместное использование параметров и имеет пространственные отношения. Теперь в случае с градиентом есть случай исчезновения и взрыва градиентов.