В этой статье вы увидите все модели, используемые в классификации изображений.
Задний план
Я считаю, что классификация изображений — отличная отправная точка перед погружением в другие области компьютерного зрения, особенно для новичков, которые ничего не знают о глубоком обучении. Когда я начал изучать компьютерное зрение, я сделал много ошибок, я бы хотел, чтобы кто-нибудь сказал мне, с какой бумаги мне начать тогда. Кажется, до сих пор не было репозитория со списком документов по классификации изображений, таких как deep_learning_object_detection. Поэтому я решил создать репозиторий со списком документов и кодов классификации изображений для глубокого обучения, чтобы помочь другим. Мой личный совет для людей, которые ничего не знают о глубоком обучении: попробуйте начать с vgg, затем googlenet, resnet, не стесняйтесь продолжать читать другие перечисленные статьи или переключаться на другие поля после того, как вы закончите.
Примечание: у меня также есть репозиторий реализации PyTorch некоторых сетей классификации изображений, вы можете посмотреть здесь.
Таблица производительности
Для простоты я перечислил только лучшую точность top1 и top5 на ImageNet из статей. Обратите внимание, что это не обязательно означает, что одна сеть лучше, чем другая, когда акк выше, потому что некоторые сети сосредоточены на уменьшении сложности модели, а не на повышении точности, или в некоторых статьях в ImageNet приводятся результаты только для одной культуры, а в других — слияние моделей или многоточечные результаты.
- ConvNet: имя сверточной сети
- ImageNet top1 acc: лучшая точность Top1 на ImageNet от Paper
- ImageNet top5 acc: лучшая пятерка точности на ImageNet от Paper
- Published In: в какой конференции или журнале статья была опубликована.
Бумаги и коды
ВГГ
Очень глубокие сверточные сети для распознавания крупномасштабных изображений.
Карен Симонян, Эндрю Зиссерман
- pdf: https://arxiv.org/abs/1409.1556
- код: torchvision: https://github.com/pytorch/vision/blob/master/torchvision/models/vgg.py
- код: keras-приложения: https://github.com/keras-team/keras-applications/blob/master/keras_applications/vgg16.py
- код: keras-приложения: https://github.com/keras-team/keras-applications/blob/master/keras_applications/vgg19.py
GoogleNet
Углубляясь в извилины
Кристиан Сегеди, Вэй Лю, Янцин Цзя, Пьер Сермане, Скотт Рид, Драгомир Ангелов, Думитру Эрхан, Винсент Ванхуке, Эндрю Рабинович
- pdf: https://arxiv.org/abs/1409.4842
- код: неофициальный-tensorflow: https://github.com/conan7882/GoogLeNet-Inception
- код: неофициальный-кафе: https://github.com/lim0606/caffe-googlenet-bn
PReLU-сети
Углубление в выпрямители: превосходство на уровне человека по классификации ImageNet
Каймин Хэ, Сянюй Чжан, Шаоцин Рен, Цзянь Сунь
- pdf: https://arxiv.org/abs/1502.01852
- код: неофициальный цепник: https://github.com/nutszebra/prelu_net
Реснет
Глубокое остаточное обучение для распознавания изображений
Каймин Хэ, Сянъюй Чжан, Шаоцин Рен, Цзянь Сунь
- pdf: https://arxiv.org/abs/1512.03385
- код: facebook-факел: https://github.com/facebook/fb.resnet.torch
- код: torchvision: https://github.com/pytorch/vision/blob/master/torchvision/models/resnet.py
- код: keras-приложения: https://github.com/keras-team/keras-applications/blob/master/keras_applications/resnet.py
- код: неофициальный-keras: https://github.com/raghakot/keras-resnet
- код: неофициальный-tensorflow: https://github.com/ry/tensorflow-resnet
ПреактРеснет
Отображение идентичности в глубоких остаточных сетях
Каймин Хе, Сянъюй Чжан, Шаоцин Рен, Цзянь Сунь
- pdf: https://arxiv.org/abs/1603.05027
- код: facebook-факел: https://github.com/facebook/fb.resnet.torch/blob/master/models/preresnet.lua
- код: официальный: https://github.com/KaimingHe/resnet-1k-layers
- код: неофициальный-pytorch: https://github.com/kuangliu/pytorch-cifar/blob/master/models/preact_resnet.py
- код: unoffical-mxnet: https://github.com/tornadomeet/ResNet
Началоv3
Переосмысление исходной архитектуры компьютерного зрения
Кристиан Сегеди, Винсент Ванхуке, Сергей Иоффе, Джонатон Шленс, Збигнев Война
- pdf: https://arxiv.org/abs/1512.00567
- код: torchvision: https://github.com/pytorch/vision/blob/master/torchvision/models/inception.py
- код: keras-приложения: https://github.com/keras-team/keras-applications/blob/master/keras_applications/inception_v3.py
Inceptionv4 && Inception-ResNetv2
Inception-v4, Inception-ResNet и влияние остаточных связей на обучение
Кристиан Сегеди, Сергей Иоффе, Винсент Ванхуке, Алекс Алеми
- pdf: https://arxiv.org/abs/1602.07261
- код: неофициальный-keras: https://github.com/kentsommer/keras-inceptionV4
- код: неофициальный-keras: https://github.com/titu1994/Inception-v4
- код: неофициальный-keras: https://github.com/yuyang-huang/keras-inception-resnet-v2
РиР
Resnet в Resnet: обобщение остаточных архитектур
Саша Тарг, Диого Алмейда, Кевин Лайман
- pdf: https://arxiv.org/abs/1603.08029
- код: неофициальный-tensorflow: https://github.com/SunnerLi/RiR-Tensorflow
- код: неофициальный цепник: https://github.com/nutszebra/resnet_in_resnet
Стохастическая глубина ResNet
Глубокие сети со стохастической глубиной
Гао Хуан, Ю Сун, Чжуан Лю, Даниэль Седра, Килиан Вайнбергер
- pdf: https://arxiv.org/abs/1603.09382
- код: неофициальный факел: https://github.com/yueatsprograms/Stochastic_Depth
- код: неофициальный чейнер: https://github.com/yasunorikudo/chainer-ResDrop
- код: неофициальный-keras: https://github.com/dblN/stochastic_depth_keras
WRN
Широкие остаточные сети
Сергей Загоруйко, Никос Комодакис
- pdf: https://arxiv.org/abs/1605.07146
- код: официальный: https://github.com/szagoruyko/wide-residual-networks
- код: неофициальный-pytorch: https://github.com/xternalz/WideResNet-pytorch
- код: неофициальный-keras: https://github.com/asmith26/wide_resnets_keras
- код: неофициальный-pytorch: https://github.com/meliketoy/wide-resnet.pytorch
SqueezeNet
SqueezeNet: точность уровня AlexNet с в 50 раз меньшим количеством параметров и размером модели ‹0,5 МБ
Форрест Н. Яндола, Сонг Хан, Мэтью В. Москевич, Халид Ашраф, Уильям Дж. Далли, Курт Койцер
- pdf: https://arxiv.org/abs/1602.07360
- код: torchvision: https://github.com/pytorch/vision/blob/master/torchvision/models/squeezenet.py
- код: неофициальное кафе: https://github.com/DeepScale/SqueezeNet
- код: неофициальный-keras: https://github.com/rcmalli/keras-squeezenet
- код: неофициальное кафе: https://github.com/songhan/SqueezeNet-Residual
GeNet
Genetic CNN
Линси Се, Алан Юйлль
- pdf: https://arxiv.org/abs/1703.01513
- код: неофициальный-tensorflow: https://github.com/aqibsaeed/Genetic-CNN
МетаQNN
Проектирование архитектур нейронных сетей с использованием обучения с подкреплением
Боуэн Бейкер, Открист Гупта, Нихил Найк, Рамеш Раскар
Пирамиднет
Глубокие пирамидальные остаточные сети
Донгьюн Хан, Дживан Ким, Джунмо Ким
- pdf: https://arxiv.org/abs/1610.02915
- код: официальный: https://github.com/jhkim89/PyramidNet
- код: неофициальный-pytorch: https://github.com/dyhan0920/PyramidNet-PyTorch
Плотная сеть
Плотно связанные сверточные сети
Гао Хуан, Чжуан Лю, Лоренс ван дер Маатен, Килиан К. Вайнбергер
- pdf: https://arxiv.org/abs/1608.06993
- код: официальный: https://github.com/liuzhuang13/DenseNet
- код: неофициальный-keras: https://github.com/titu1994/DenseNet
- код: неофициальное кафе: https://github.com/shicai/DenseNet-Caffe
- код: неофициальный-tensorflow: https://github.com/YixuanLi/densenet-tensorflow
- код: неофициальный-pytorch: https://github.com/YixuanLi/densenet-tensorflow
- код: неофициальный-pytorch: https://github.com/bamos/densenet.pytorch
- код: неофициальный-keras: https://github.com/flyyufelix/DenseNet-Keras
Фрактальная сеть
FractalNet: сверхглубокие нейронные сети без остатков
Густав Ларссон, Майкл Мейр, Григорий Шахнарович
- pdf: https://arxiv.org/abs/1605.07648
- код: неофициальное кафе: https://github.com/gustavla/fractalnet
- код: неофициальный-keras: https://github.com/snf/keras-fractalnet
- код: неофициальный-tensorflow: https://github.com/tensorpro/FractalNet
ResNext
Агрегированные остаточные преобразования для глубоких нейронных сетей
Сайнин Се, Росс Гиршик, Петр Доллар, Жуовен Ту, Кайминг Хе
- pdf: https://arxiv.org/abs/1611.05431
- код: официальный: https://github.com/facebookresearch/ResNeXt
- код: keras-приложения: https://github.com/keras-team/keras-applications/blob/master/keras_applications/resnext.py
- код: неофициальный-pytorch: https://github.com/prlz77/ResNeXt.pytorch
- код: неофициальный-keras: https://github.com/titu1994/Keras-ResNeXt
- код: неофициальный-tensorflow: https://github.com/taki0112/ResNeXt-Tensorflow
- код: неофициальный-tensorflow: https://github.com/wenxinxu/ResNeXt-in-tensorflow
IGCV1
Групповые свертки с чередованием для глубоких нейронных сетей
Тинг Чжан, Го-Цзюнь Ци, Бинь Сяо, Цзиндонг Ван
- pdf: https://arxiv.org/abs/1707.02725
- код официальный: https://github.com/hellozting/InterleavedGroupConvolutions
Сеть остаточного внимания
Сеть остаточного внимания для классификации изображений
Фей Ван, Мэнцин Цзян, Чен Цянь, Шуо Ян, Ченг Ли, Хунган Чжан, Сяоган Ван, Сяоу Тан
- pdf: https://arxiv.org/abs/1704.06904
- код: официальный: https://github.com/fwang91/residual-attention-network
- код: неофициальный-pytorch: https://github.com/tengshaofeng/ResidualAttentionNetwork-pytorch
- код: неофициальный глюон: https://github.com/PistonY/ResidualAttentionNetwork
- код: неофициальный-keras: https://github.com/koichiro11/residual-attention-network
Восприятие
Xception: глубокое обучение с помощью глубоких отделимых сверток
Франсуа Шолле
- pdf: https://arxiv.org/abs/1610.02357
- код: неофициальный-pytorch: https://github.com/jfzhang95/pytorch-deeplab-xception/blob/master/modeling/backbone/xception.py
- код: неофициальный-tensorflow: https://github.com/kwotsin/TensorFlow-Xception
- код: неофициальное кафе: https://github.com/yihui-he/Xception-caffe
- код: неофициальный-pytorch: https://github.com/tstandley/Xception-PyTorch
- код: keras-приложения: https://github.com/keras-team/keras-applications/blob/master/keras_applications/xception.py
Мобильная сеть
MobileNets: эффективные сверточные нейронные сети для приложений мобильного зрения.
- pdf: https://arxiv.org/abs/1704.04861
- код: неофициальный-tensorflow: https://github.com/Zehaos/MobileNet
- код: неофициальное кафе: https://github.com/shicai/MobileNet-Caffe
- код: неофициальный-pytorch: https://github.com/marvis/pytorch-mobilenet
- код: keras-приложения: https://github.com/keras-team/keras-applications/blob/master/keras_applications/mobilenet.py
Полинет
PolyNet: Стремление к структурному разнообразию в очень глубоких сетях
Xingcheng Zhang, Zhizhong Li, Chen Change Loy, Dahua Lin
ДПН
Сети двойного пути
Юнпэн Чен, Цзяньань Ли, Хуаксинь Сяо, Сяоцзе Цзинь, Шуичэн Ян, Цзяши Фэн
- pdf: https://arxiv.org/abs/1707.01629
- код: официальный: https://github.com/cypw/DPNs
- код: unoffical-keras: https://github.com/titu1994/Keras-DualPathNetworks
- код: неофициальный-pytorch: https://github.com/oyam/pytorch-DPNs
- код: неофициальный-pytorch: https://github.com/rwightman/pytorch-dpn-pretrained
Блок-QNN
Практическое создание блочной архитектуры нейронной сети
Чжао Чжун, Цзюньцзе Ян, Вэй Ву, Цзин Шао, Ченг-Лин Лю
CRU-Net
Совместное использование остаточных единиц посредством коллективной тензорной факторизации в глубоких нейронных сетях
Чен Юньпэн, Цзинь Сяоцзе, Кан Бинъи, Фэн Цзяши, Ян Шуичэн
- pdf: https://arxiv.org/abs/1703.02180
- код официальный: https://github.com/cypw/CRU-Net
- код неофициальный-mxnet: https://github.com/bruinxiong/Modified-CRUNet-and-Residual-Attention-Network.mxnet
ShuffleNet
ShuffleNet: Чрезвычайно эффективная сверточная нейронная сеть для мобильных устройств
Xiangyu Zhang, Xinyu Zhou, Mengxiao Lin, Jian Sun
- pdf: https://arxiv.org/abs/1707.01083
- код: неофициальный-tensorflow: https://github.com/MG2033/ShuffleNet
- код: неофициальный-pytorch: https://github.com/jaxony/ShuffleNet
- код: неофициальное кафе: https://github.com/farmingyard/ShuffleNet
- код: неофициальный-keras: https://github.com/scheckmedia/keras-shufflenet
Конденснет
CondenseNet: эффективная DenseNet с использованием изученных групповых сверток
Гао Хуан, Шичен Лю, Лоренс ван дер Маатен, Килиан К. Вайнбергер
- pdf: https://arxiv.org/abs/1711.09224
- код: официальный: https://github.com/ShichenLiu/CondenseNet
- код: неофициальный-tensorflow: https://github.com/markdtw/dendenet-tensorflow
НасНет
Изучение переносимых архитектур для масштабируемого распознавания изображений
Баррет Зоф, Виджай Васудеван, Джонатон Шленс, Куок В. Ле
- pdf: https://arxiv.org/abs/1707.07012
- код: неофициальный-keras: https://github.com/titu1994/Keras-NASNet
- код: keras-приложения: https://github.com/keras-team/keras-applications/blob/master/keras_applications/nasnet.py
- код: неофициальный-pytorch: https://github.com/wandering007/nasnet-pytorch
- код: неофициальный-tensorflow: https://github.com/yeephycho/nasnet-tensorflow
МобильныйNetV2
MobileNetV2: обратные остатки и линейные узкие места
Марк Сэндлер, Эндрю Ховард, Мэнлонг Чжу, Андрей Жмогинов, Лян-Чие Чен
- pdf: https://arxiv.org/abs/1801.04381
- код: неофициальный-keras: https://github.com/xiaochus/MobileNetV2
- код: неофициальный-pytorch: https://github.com/Randl/MobileNetV2-pytorch
- код: неофициальный-tensorflow: https://github.com/neuleaf/MobileNetV2
IGCV2
IGCV2: чередующиеся структурированные разреженные сверточные нейронные сети
Guotian Xie, Jingdong Wang, Ting Zhang, Jianhuang Lai, Richang Hong, Guo-Jun Qi
выше
Иерархические представления для эффективного поиска архитектуры
Hanxiao Liu, Karen Simonyan, Oriol Vinyals, Chrisantha Fernando, Koray Kavukcuoglu
PNasNet
Поиск прогрессивной нейронной архитектуры
Ченкси Лю, Баррет Зоф, Максим Нейманн, Джонатон Шленс, Вей Хуа, Ли-Цзя Ли, Ли Фей-Фей, Алан Юилле, Джонатан Хуан, Кевин Мерфи
- pdf: https://arxiv.org/abs/1712.00559
- код: tensorflow-slim: https://github.com/tensorflow/models/blob/master/research/slim/nets/nasnet/pnasnet.py
- код: неофициальный-pytorch: https://github.com/chenxi116/PNASNet.pytorch
- код: неофициальный-tensorflow: https://github.com/chenxi116/PNASNet.TF
AmoebaNet
Регуляризованная эволюция для поиска архитектуры классификатора изображений
Эстебан Реал, Алок Аггарвал, Янпинг Хуанг, Куок В Ле
- pdf: https://arxiv.org/abs/1802.01548
- код: tensorflow-tpu: https://github.com/tensorflow/tpu/tree/master/models/official/amoeba_net
SENet
Сети сжатия и возбуждения
Цзе Ху, Ли Шен, Сэмюэл Олбани, Ган Сун, Энхуа Ву
- pdf: https://arxiv.org/abs/1709.01507
- код: официальный: https://github.com/hujie-frank/SENet
- код: неофициальный-pytorch: https://github.com/moskomule/senet.pytorch
- код: неофициальный-tensorflow: https://github.com/taki0112/SENet-Tensorflow
- код: неофициальное кафе: https://github.com/shicai/SENet-Caffe
- код: неофициальный-mxnet: https://github.com/bruinxiong/SENet.mxnet
ShuffleNetV2
ShuffleNet V2: Практические рекомендации по эффективному проектированию архитектуры CNN
Ниннин Ма, Сянъюй Чжан, Хай-Тао Чжэн, Цзянь Сунь
- pdf: https://arxiv.org/abs/1807.11164
- код: неофициальный-pytorch: https://github.com/Randl/ShuffleNetV2-pytorch
- код: неофициальный-keras: https://github.com/opconty/keras-shufflenetV2
- код: неофициальный-pytorch: https://github.com/Bugdragon/ShuffleNet_v2_PyTorch
- код: неофициальный-caff2: https://github.com/wolegechu/ShuffleNetV2.Caffe2
IGCV3
IGCV3: чередующиеся групповые свертки низкого ранга для эффективных глубоких нейронных сетей
Ке Сун, Минджи Ли, Донг Лю, Цзиндонг Ван
- pdf: https://arxiv.org/abs/1806.00178
- код: официальный: https://github.com/homles11/IGCV3
- код: неофициальный-pytorch: https://github.com/xxradon/IGCV3-pytorch
- код: неофициальный-tensorflow: https://github.com/ZHANG-SHI-CHANG/IGCV3
МНасНет
MnasNet: Поиск нейронной архитектуры с учетом платформы для мобильных устройств
Минсин Тан, Бо Чен, Руоминг Панг, Виджай Васудеван, Куок В. Ле
- pdf: https://arxiv.org/abs/1807.11626
- код: неофициальный-pytorch: https://github.com/AnjieZheng/MnasNet-PyTorch
- код: неофициальное кафе: https://github.com/LiJianfei06/MnasNet-caffe
- код: неофициальный-MxNet: https://github.com/chinakook/Mnasnet.MXNet
- код: неофициальный-keras: https://github.com/Shathe/MNasNet-Keras-Tensorflow
СКнет
Selective Kernel Networks
Сян Ли, Вэньхай Ван, Сяолинь Ху, Цзянь Ян
ДАРТС
DARTS: Поиск дифференцируемой архитектуры
Хансяо Лю, Карен Симонян, Имин Ян
- pdf: https://arxiv.org/abs/1806.09055
- код: официальный: https://github.com/quark0/darts
- код: неофициальный-pytorch: https://github.com/khanrc/pt.darts
- код: неофициальный-tensorflow: https://github.com/NeroLoh/darts-tensorflow
ProxylessNAS
ProxylessNAS: прямой поиск нейронной архитектуры по целевой задаче и оборудованию
Хан Кай, Лигенг Чжу, Сун Хань
Мобильная сеть V3
В поисках MobileNetV3
Эндрю Ховард, Марк Сэндлер, Грейс Чу, Лян-Чие Чен, Бо Чен, Минсин Тан, Вэйцзюнь Ван, Юкунь Чжу, Руоминг Панг, Виджай Васудеван, Куок В. Ле, Хартвиг Адам
- pdf: https://arxiv.org/abs/1905.02244
- код: неофициальный-pytorch: https://github.com/xiaolai-sqlai/mobilenetv3
- код: неофициальный-pytorch: https://github.com/kuan-wang/pytorch-mobilenet-v3
- код: неофициальный-pytorch: https://github.com/leaderj1001/MobileNetV3-Pytorch
- код: неофициальный-pytorch: https://github.com/d-li14/mobilenetv3.pytorch
- код: неофициальный-кафе: https://github.com/jixing0415/caffe-mobilenet-v3
- код: неофициальный-keras: https://github.com/xiaochus/MobileNetV3
Res2Net
Res2Net: новая многомасштабная магистральная архитектура
Шан-Хуа Гао, Мин-Минг Ченг, Кай Чжао, Синь-Ю Чжан, Мин-Сюань Ян, Филип Торр
- pdf: https://arxiv.org/abs/1904.01169
- код: неофициальный-pytorch: https://github.com/4uiiurz1/pytorch-res2net
- код: неофициальный-keras: https://github.com/fupiao1998/res2net-keras
Откуда: https://github.com/amusi/awesome-object-detection
Вывод
Если вы только собираетесь начать свое машинное обучение и хотите учиться с нуля, я буду делать эту серию, которая будет длиться 5–6 минут о машинном обучении и некоторых побочных проектах в конце каждой главы, так что следите за обновлениями и будьте счастливы обучение
Это мое личное исследование, если у вас есть какие-либо комментарии, пожалуйста, свяжитесь со мной.
Добро пожаловать на мою среднюю страницу