Во многих работах упоминается, что текстовые области приводят к высоким собственным значениям, вычисляемым из значений пикселей уровня серого после того, как изображение было разделено на блоки матриц mxm. Кроме того, собственные значения являются мерой «шероховатости» текстуры изображения.
Как это связано с получением текста? Текстовые области обычно имеют два цвета: фон и передний план с однородным цветом штрихов букв. Где эта шероховатость? Может быть много других признаков, которые были бы более грубыми и вызывали бы высокие собственные значения. Может ли кто-нибудь указать, где взять математику, которая связывает эти вещи?
РЕДАКТИРОВАНИЕ: несколько статей, в которых упоминаются собственные значения в контексте обнаружения текста в естественных сценах.
Основа обнаружения и отслеживания текста в реальном времени использует собственное преобразование для изображения в оттенках серого.
Подход к обнаружению текста в видео на основе собственных значений упоминает вычисление собственных значений из ковариационной матрицы. градиент изображения.