Понимание ResNet и его вариантов

Обзор самых революционных работ в сообществе компьютерного зрения / глубокого обучения - ResNets

С появлением больших вычислительных единиц сообщество машинного обучения стало свидетелем сдвига парадигмы в сторону методов глубокого обучения для достижения лучших результатов, особенно в области компьютерного зрения. Одним из многообещающих подходов является сверточная нейронная сеть. CNN - это улучшенная версия традиционных нейронных сетей, которая сохраняет неизменным пространственное измерение.

CNN превзошла различные другие системы для классификации изображений, обнаружения объектов и т. Д. И поэтому представляет большой интерес для исследователей. Стремясь сделать это изучение более точным, исследователи начали внедрять все более глубокие сети свертки.

Тема выбора правильного количества слоев для обучения обсуждалась в течение долгого времени, и, как оказалось, создание более глубокой Сети не улучшает точность, а, скорее, ухудшает ее. Да, вы правильно расслышали, поскольку вы складываете все больше и больше устройств в сеть, обучающая способность сети насыщается, и после определенного порогового значения она падает.

Две основные причины, по которым точность таких сетей падает, а не повышается:

Исчезающие / взрывающиеся градиенты
Проблема деградации

Однако первая проблема решена за счет нормализованных уровней инициализации и промежуточной нормализации, которые позволяют сетям с десятками уровней начать сходиться для стохастического градиентного спуска (SGD) с обратным распространением.

Но когда более глубокие сети начинают сближаться, они наблюдают проблему деградации. По мере увеличения глубины сети точность достигает насыщения, а затем быстро ухудшается. Один из способов помочь устранить эту проблему деградации - добавить дополнительные слои с сопоставлением идентичности.

ResNet [1] представляет эти «сопоставление идентификаторов» или «пропуск подключений», которые пропускают один или несколько слоев, как показано на рисунке:

Идея состоит в том, что вместо того, чтобы просто складывать дополнительные уровни в сеть, мы добавляем их как остаточные блоки (с сопоставлениями идентичности). Чтобы добиться результатов в этой схеме, авторы работы изменили базовое отображение и заставили нелинейные слои изучать отображение:

вместо обычного отображения H (x), и исходное отображение преобразовывается в:

Еще одно преимущество введения этих сокращенных соединений состоит в том, что они не добавляют никаких дополнительных параметров и не увеличивают вычислительную сложность, поскольку они используются в качестве сопоставлений идентичности. Однако они гарантируют, что более глубокие сети работают так же хорошо, как и более мелкие.

Первоначально предложенная структура ResNet представлена ниже:

Здесь стоит обратить внимание на пунктирные линии, обозначающие линейную проекцию. В идеале, чтобы выполнить сопоставление идентичности, размеры как F (x), так и X должны быть одинаковыми, но когда это не так, мы используем вектор проекции Ws, чтобы помочь сопоставить размеры.

Другое исследование было проведено, чтобы точно определить, когда следует вводить эти «пропускные соединения»!

Все возможные комбинации были протестированы и опробованы перед тем, как перейти к окончательной версии остаточного блока, имеющего полную предварительную активацию, то есть (e) на приведенном выше рисунке.

Благодаря своим убедительным результатам ResNet быстро стала одной из самых популярных архитектур для решения различных задач компьютерного зрения.

Использованная литература :

[1]. К. Хе, Х. Чжан, С. Рен и Дж. Сунь. Глубокое остаточное обучение для распознавания изображений. Препринт arXiv arXiv: 1512.03385,2015.

[2]. С. Се, Р. Гиршик, П. Доллар, З. Ту и К. Хе. Агрегированные остаточные преобразования для глубоких нейронных сетей. Препринт arXiv arXiv: 1611.05431v1,2016.

[3]. К. Сегеди, В. Лю, Ю. Цзя, П. Серманет, С. Рид, Д. Ангелов, Д. Эрхан, В. Ванхаук и А. Рабинович. Углубляем извилины. В материалах конференции IEEE по компьютерному зрению и распознаванию образов, страницы 1–9,2015.

[4]. Г. Хуанг, З. Лю, К. К. Вайнбергер и Л. Маатен. Плотно связанные сверточные сети. arXiv: 1608.06993v3,2016.

Понимание ResNet и его вариантов

Обзор самых революционных работ в сообществе компьютерного зрения / глубокого обучения - ResNets

Популярные варианты ResNets

ResNeXt

DenseNet

Использованная литература :

Понимание ResNet и его вариантов

Обзор самых революционных работ в сообществе компьютерного зрения / глубокого обучения - ResNets

Популярные варианты ResNets

ResNeXt

DenseNet

Использованная литература :

Вопросы по теме