1. PCBDet: эффективная архитектура обнаружения объектов глубокой нейронной сети для автоматического обнаружения компонентов печатных плат на периферии(arXiv)

Автор: Брайан Ли, Стивен Палайю, Фрэнсис Ли, Саад Аббаси, Саиджит Наир, Александр Вонг

Вывод. На данной печатной плате может быть множество электронных компонентов, что делает задачу визуального осмотра для обнаружения дефектов очень трудоемкой и подверженной ошибкам, особенно в масштабе. Таким образом, существует значительный интерес к автоматическому обнаружению компонентов печатных плат, особенно с использованием глубокого обучения. Однако глубокие нейронные сети обычно требуют больших вычислительных ресурсов, что, возможно, ограничивает их возможности в реальных сценариях использования в производстве, которые часто включают обнаружение большого объема и высокой пропускной способности с ограниченной доступностью ресурсов периферийных вычислений. В результате исследования эффективных архитектур глубоких нейронных сетей для этого варианта использования мы представляем PCBDet, дизайн сети с конденсатором внимания, который обеспечивает самую современную пропускную способность для логического вывода, обеспечивая при этом превосходную производительность обнаружения компонентов печатной платы по сравнению с другими современными решениями. -современные эффективные архитектурные решения. Экспериментальные результаты показывают, что PCBDet может увеличить скорость логического вывода на процессоре ARM Cortex A72 до 2 раз по сравнению с конструкцией на основе EfficientNet, достигнув при этом примерно на 2–4% более высокого значения mAP в наборе данных FICS-PCB.

2.Двунаправленное распространение для кросс-модального обнаружения 3D-объектов(arXiv)

Автор: Ифань Чжан, Цицзянь Чжан, Цзюньхуэй Хоу, Исюань Юань, Голян Син

Аннотация: Недавние работы показали превосходство слияния на уровне признаков для кросс-модального обнаружения 3D-объектов, где для повышения производительности широко используется мелкозернистое распространение признаков от пикселей 2D-изображения к точкам 3D LiDAR. Тем не менее, потенциал распространения гетерогенных признаков между 2D и 3D областями изучен не полностью. В этой статье, в отличие от существующего распространения признаков от пикселя к точке, мы исследуем противоположное направление от точки к пикселю, позволяя точечным признакам перетекать обратно в ветвь 2D-изображения. Таким образом, при совместной оптимизации 2D- и 3D-потоков обратное распространение градиентов из ветви 2D-изображения может повысить способность представления магистральной 3D-сети, работающей с облаками точек LiDAR. Затем, комбинируя механизмы потоков информации пиксель-точка и точка-пиксель, мы создаем структуру двунаправленного распространения признаков, получившую название BiProDet. В дополнение к архитектурному проекту мы также предлагаем нормализованную оценку карты локальных координат, новую вспомогательную 2D-задачу для обучения ветви 2D-изображения, которая облегчает изучение локальных пространственных функций из модальности изображения и неявно повышает общую производительность 3D-обнаружения. . Обширные эксперименты и исследования абляции подтверждают эффективность нашего метода. Примечательно, что на момент подачи заявки мы занимаем 1-е место в высококонкурентном тесте KITTI в классе велосипедистов. Исходный код доступен по адресу https://github.com/Eaphan/BiProDe.