Для более точного извлечения представлений признаков мы можем вычислить градиент изображения для краевых конструкций данного изображения. Наиболее известным применением градиента изображения является обнаружение краев, основанное на свертке изображения с помощью фильтра. В заданном направлении фильтра градиентное изображение определяет свою интенсивность от каждого пикселя исходного изображения, а пиксели с большими значениями градиента становятся возможными краевыми пикселями.

В каждой точке изображения градиент функции интенсивности изображения приводит к двумерному вектору, который имеет компоненты производных как в вертикальном, так и в горизонтальном направлениях. Чтобы аппроксимировать производные, он сворачивает изображение с ядром, и наиболее распространенным фильтром свертки, который мы здесь используем, является оператор Собеля, который представляет собой небольшой, разделимый и целочисленный фильтр, который выводит вектор градиента или норму. .

Пусть S — исходное изображение, и есть два ядра Собеля 3 x 3 Sx и Sy для вычисления аппроксимаций градиента в вертикальном и горизонтальном направлениях соответственно.

Чтобы получить аппроксимацию градиента, производные изображения свертываются через ядра Собеля.

Gx — аппроксимация градиента для вертикальных изменений, а Gy — аппроксимация горизонтального градиента. Оба рассчитываются как

Gx = Sx * ∆S и Gy = Sy * ∆S,

Где * представляет операцию двумерной свертки

Чтобы получить вертикальное и горизонтальное представление ребра, объедините полученные аппроксимации градиента, взяв корень квадрата суммы этих аппроксимаций, Gx и Gy.

Градиент изображения может быть рассчитан на тензорах, а края построены на платформе PyTorch, и вы можете сослаться на код следующим образом.



Меня зовут Анумол, я инженер-аспирант. Загляните в мой профиль LinkedIn.

Если вам понравилась эта статья, пожалуйста, порекомендуйте ее и поделитесь ею! Спасибо за ваше время.