Авторы: Дэн Хендрикс, Томас Г. Диттерих.



Большая часть существующих работ по устойчивости методов глубокого обучения для зрения была сосредоточена на важных проблемах устойчивости к состязательным примерам (Szegedy et al., 2014; Carlini & Wagner, 2017; 2016), неизвестным неизвестным (Liu et al., 2018), отравление моделью или данными (Blanchard et al., 2017; Steinhardt et al., 2017; Hendrycks et al., 2018). Напротив, они разрабатывают и проверяют наборы данных для двух других форм устойчивости: устойчивость к искажениям и устойчивость к возмущениям.

Чтобы создать IMAGENET-C, они вводят набор из 75 распространенных визуальных искажений и применяют их к ImageNet в надежде, что это послужит общим набором данных для сравнительного анализа устойчивости к искажениям изображения и предотвращения методологических проблем, таких как перемещение стоек ворот и результатов. сбор вишни. Они оценивают производительность существующих систем глубокого обучения и показывают, что в IMAGENET-C есть много возможностей для улучшения. Они также представляют в общей сложности три метода и архитектуры, которые повышают устойчивость к коррупции без потери точности.

Чтобы создать IMAGENET-P, они вводят набор искаженных или слегка различающихся изображений ImageNet. Используя предложенные ими метрики, они измеряют стабильность прогнозов сети на этих искаженных изображениях. Хотя эти возмущения не выбираются противником, существующие в настоящее время сети демонстрируют удивительную нестабильность при обычных возмущениях. Затем они демонстрируют, что подходы, повышающие устойчивость к коррупции, также могут повысить устойчивость к возмущениям. Например, некоторые последние архитектуры могут значительно повысить надежность обоих типов. Более того, они показывают, что защита от состязательного примера состязательной пары логитов l∞ может дать существенный прирост устойчивости к разнообразным и общим возмущениям.

Определяя и оценивая устойчивость к возмущениям и искажениям, они облегчают исследования, которые могут быть преодолены будущими сетями, которые не полагаются на ложные корреляции или сигналы, несущественные для класса объекта.