ВАЖНО Все о классификации изображений

В этой статье вы увидите все модели, используемые в классификации изображений.

Задний план

Я считаю, что классификация изображений — отличная отправная точка перед погружением в другие области компьютерного зрения, особенно для новичков, которые ничего не знают о глубоком обучении. Когда я начал изучать компьютерное зрение, я сделал много ошибок, я бы хотел, чтобы кто-нибудь сказал мне, с какой бумаги мне начать тогда. Кажется, до сих пор не было репозитория со списком документов по классификации изображений, таких как deep_learning_object_detection. Поэтому я решил создать репозиторий со списком документов и кодов классификации изображений для глубокого обучения, чтобы помочь другим. Мой личный совет для людей, которые ничего не знают о глубоком обучении: попробуйте начать с vgg, затем googlenet, resnet, не стесняйтесь продолжать читать другие перечисленные статьи или переключаться на другие поля после того, как вы закончите.

Примечание: у меня также есть репозиторий реализации PyTorch некоторых сетей классификации изображений, вы можете посмотреть здесь.

Таблица производительности

Для простоты я перечислил только лучшую точность top1 и top5 на ImageNet из статей. Обратите внимание, что это не обязательно означает, что одна сеть лучше, чем другая, когда акк выше, потому что некоторые сети сосредоточены на уменьшении сложности модели, а не на повышении точности, или в некоторых статьях в ImageNet приводятся результаты только для одной культуры, а в других — слияние моделей или многоточечные результаты.

ConvNet: имя сверточной сети
ImageNet top1 acc: лучшая точность Top1 на ImageNet от Paper
ImageNet top5 acc: лучшая пятерка точности на ImageNet от Paper
Published In: в какой конференции или журнале статья была опубликована.

Бумаги и коды

ВГГ

Очень глубокие сверточные сети для распознавания крупномасштабных изображений.
Карен Симонян, Эндрю Зиссерман

GoogleNet

Углубляясь в извилины
Кристиан Сегеди, Вэй Лю, Янцин Цзя, Пьер Сермане, Скотт Рид, Драгомир Ангелов, Думитру Эрхан, Винсент Ванхуке, Эндрю Рабинович

PReLU-сети

Углубление в выпрямители: превосходство на уровне человека по классификации ImageNet
Каймин Хэ, Сянюй Чжан, Шаоцин Рен, Цзянь Сунь

Реснет

Глубокое остаточное обучение для распознавания изображений
Каймин Хэ, Сянъюй Чжан, Шаоцин Рен, Цзянь Сунь

ПреактРеснет

Отображение идентичности в глубоких остаточных сетях
Каймин Хе, Сянъюй Чжан, Шаоцин Рен, Цзянь Сунь

Началоv3

Переосмысление исходной архитектуры компьютерного зрения
Кристиан Сегеди, Винсент Ванхуке, Сергей Иоффе, Джонатон Шленс, Збигнев Война

Inceptionv4 && Inception-ResNetv2

Inception-v4, Inception-ResNet и влияние остаточных связей на обучение
Кристиан Сегеди, Сергей Иоффе, Винсент Ванхуке, Алекс Алеми

РиР

Resnet в Resnet: обобщение остаточных архитектур
Саша Тарг, Диого Алмейда, Кевин Лайман

Стохастическая глубина ResNet

Глубокие сети со стохастической глубиной
Гао Хуан, Ю Сун, Чжуан Лю, Даниэль Седра, Килиан Вайнбергер

WRN

Широкие остаточные сети
Сергей Загоруйко, Никос Комодакис

SqueezeNet

SqueezeNet: точность уровня AlexNet с в 50 раз меньшим количеством параметров и размером модели ‹0,5 МБ
Форрест Н. Яндола, Сонг Хан, Мэтью В. Москевич, Халид Ашраф, Уильям Дж. Далли, Курт Койцер

GeNet

Genetic CNN
Линси Се, Алан Юйлль

МетаQNN

Проектирование архитектур нейронных сетей с использованием обучения с подкреплением
Боуэн Бейкер, Открист Гупта, Нихил Найк, Рамеш Раскар

Пирамиднет

Глубокие пирамидальные остаточные сети
Донгьюн Хан, Дживан Ким, Джунмо Ким

Плотная сеть

Плотно связанные сверточные сети
Гао Хуан, Чжуан Лю, Лоренс ван дер Маатен, Килиан К. Вайнбергер

Фрактальная сеть

FractalNet: сверхглубокие нейронные сети без остатков
Густав Ларссон, Майкл Мейр, Григорий Шахнарович

ResNext

Агрегированные остаточные преобразования для глубоких нейронных сетей
Сайнин Се, Росс Гиршик, Петр Доллар, Жуовен Ту, Кайминг Хе

IGCV1

Групповые свертки с чередованием для глубоких нейронных сетей
Тинг Чжан, Го-Цзюнь Ци, Бинь Сяо, Цзиндонг Ван

Сеть остаточного внимания

Сеть остаточного внимания для классификации изображений
Фей Ван, Мэнцин Цзян, Чен Цянь, Шуо Ян, Ченг Ли, Хунган Чжан, Сяоган Ван, Сяоу Тан

Восприятие

Xception: глубокое обучение с помощью глубоких отделимых сверток
Франсуа Шолле

Мобильная сеть

MobileNets: эффективные сверточные нейронные сети для приложений мобильного зрения.

Полинет

PolyNet: Стремление к структурному разнообразию в очень глубоких сетях
Xingcheng Zhang, Zhizhong Li, Chen Change Loy, Dahua Lin

ДПН

Сети двойного пути
Юнпэн Чен, Цзяньань Ли, Хуаксинь Сяо, Сяоцзе Цзинь, Шуичэн Ян, Цзяши Фэн

Блок-QNN

Практическое создание блочной архитектуры нейронной сети
Чжао Чжун, Цзюньцзе Ян, Вэй Ву, Цзин Шао, Ченг-Лин Лю

pdf: https://arxiv.org/abs/1708.05552

CRU-Net

Совместное использование остаточных единиц посредством коллективной тензорной факторизации в глубоких нейронных сетях
Чен Юньпэн, Цзинь Сяоцзе, Кан Бинъи, Фэн Цзяши, Ян Шуичэн

ShuffleNet

ShuffleNet: Чрезвычайно эффективная сверточная нейронная сеть для мобильных устройств
Xiangyu Zhang, Xinyu Zhou, Mengxiao Lin, Jian Sun

Конденснет

CondenseNet: эффективная DenseNet с использованием изученных групповых сверток
Гао Хуан, Шичен Лю, Лоренс ван дер Маатен, Килиан К. Вайнбергер

НасНет

Изучение переносимых архитектур для масштабируемого распознавания изображений
Баррет Зоф, Виджай Васудеван, Джонатон Шленс, Куок В. Ле

МобильныйNetV2

MobileNetV2: обратные остатки и линейные узкие места
Марк Сэндлер, Эндрю Ховард, Мэнлонг Чжу, Андрей Жмогинов, Лян-Чие Чен

IGCV2

IGCV2: чередующиеся структурированные разреженные сверточные нейронные сети
Guotian Xie, Jingdong Wang, Ting Zhang, Jianhuang Lai, Richang Hong, Guo-Jun Qi

pdf: https://arxiv.org/abs/1804.06202

выше

Иерархические представления для эффективного поиска архитектуры
Hanxiao Liu, Karen Simonyan, Oriol Vinyals, Chrisantha Fernando, Koray Kavukcuoglu

pdf: https://arxiv.org/abs/1711.00436

PNasNet

Поиск прогрессивной нейронной архитектуры
Ченкси Лю, Баррет Зоф, Максим Нейманн, Джонатон Шленс, Вей Хуа, Ли-Цзя Ли, Ли Фей-Фей, Алан Юилле, Джонатан Хуан, Кевин Мерфи

AmoebaNet

Регуляризованная эволюция для поиска архитектуры классификатора изображений
Эстебан Реал, Алок Аггарвал, Янпинг Хуанг, Куок В Ле

SENet

Сети сжатия и возбуждения
Цзе Ху, Ли Шен, Сэмюэл Олбани, Ган Сун, Энхуа Ву

ShuffleNetV2

ShuffleNet V2: Практические рекомендации по эффективному проектированию архитектуры CNN
Ниннин Ма, Сянъюй Чжан, Хай-Тао Чжэн, Цзянь Сунь

IGCV3

IGCV3: чередующиеся групповые свертки низкого ранга для эффективных глубоких нейронных сетей
Ке Сун, Минджи Ли, Донг Лю, Цзиндонг Ван

МНасНет

MnasNet: Поиск нейронной архитектуры с учетом платформы для мобильных устройств
Минсин Тан, Бо Чен, Руоминг Панг, Виджай Васудеван, Куок В. Ле

СКнет

Selective Kernel Networks
Сян Ли, Вэньхай Ван, Сяолинь Ху, Цзянь Ян

ДАРТС

DARTS: Поиск дифференцируемой архитектуры
Хансяо Лю, Карен Симонян, Имин Ян

ProxylessNAS

ProxylessNAS: прямой поиск нейронной архитектуры по целевой задаче и оборудованию
Хан Кай, Лигенг Чжу, Сун Хань

Мобильная сеть V3

В поисках MobileNetV3
Эндрю Ховард, Марк Сэндлер, Грейс Чу, Лян-Чие Чен, Бо Чен, Минсин Тан, Вэйцзюнь Ван, Юкунь Чжу, Руоминг Панг, Виджай Васудеван, Куок В. Ле, Хартвиг Адам

Res2Net

Res2Net: новая многомасштабная магистральная архитектура
Шан-Хуа Гао, Мин-Минг Ченг, Кай Чжао, Синь-Ю Чжан, Мин-Сюань Ян, Филип Торр

Откуда: https://github.com/amusi/awesome-object-detection

Вывод

Если вы только собираетесь начать свое машинное обучение и хотите учиться с нуля, я буду делать эту серию, которая будет длиться 5–6 минут о машинном обучении и некоторых побочных проектах в конце каждой главы, так что следите за обновлениями и будьте счастливы обучение

Это мое личное исследование, если у вас есть какие-либо комментарии, пожалуйста, свяжитесь со мной.

Добро пожаловать на мою среднюю страницу

Github, LinkedIn, Захра Эльхамрауи, Upwork