Собственные преобразования: почему высокие собственные значения указывают области текста?

Во многих работах упоминается, что текстовые области приводят к высоким собственным значениям, вычисляемым из значений пикселей уровня серого после того, как изображение было разделено на блоки матриц mxm. Кроме того, собственные значения являются мерой «шероховатости» текстуры изображения.

Как это связано с получением текста? Текстовые области обычно имеют два цвета: фон и передний план с однородным цветом штрихов букв. Где эта шероховатость? Может быть много других признаков, которые были бы более грубыми и вызывали бы высокие собственные значения. Может ли кто-нибудь указать, где взять математику, которая связывает эти вещи?

РЕДАКТИРОВАНИЕ: несколько статей, в которых упоминаются собственные значения в контексте обнаружения текста в естественных сценах.

  1. Основа обнаружения и отслеживания текста в реальном времени использует собственное преобразование для изображения в оттенках серого.

  2. Подход к обнаружению текста в видео на основе собственных значений упоминает вычисление собственных значений из ковариационной матрицы. градиент изображения.


person AruniRC    schedule 19.04.2011    source источник
comment
Это способ расплывчато ответить правильно, но одно из объяснений может заключаться в том, что передний план состоит из большого количества тонких линий, так что нет большого пространства любого цвета.   -  person David Thornley    schedule 19.04.2011
comment
Если вы спросите об утверждениях, сделанных в газетах, вы должны указать эти бумаги. Не обязательно быть ссылкой, чтобы ее можно было найти.   -  person ypnos    schedule 19.04.2011
comment
собственные значения чего? изображения (как матрицы), корреляционной матрицы или чего?   -  person leonbloy    schedule 19.04.2011
comment
@leonbloy - собственные значения изображения в виде матрицы, а также ковариационной матрицы градиентного изображения, как упоминалось в различных подходах в статьях. Однако все указывает на тот факт, что текст порождает высокие собственные значения как способ различения текстовых и нетекстовых областей.   -  person AruniRC    schedule 20.04.2011


Ответы (1)


Просто ориентация, чтобы вы могли начать читать и в конечном итоге лучше сфокусироваться на своем следующем вопросе:

Вы говорите об анализе основных компонентов

Вот вам пример приложения:

введите здесь описание изображения

HTH, чтобы вы начали.

person Dr. belisarius    schedule 19.04.2011
comment
Спасибо. Я читал об анализе PCA, но в основном касался математики, не специально выясняя концепцию преобразования текста в высокое собственное значение. Буду читать еще. - person AruniRC; 20.04.2011
comment
books.google.com/ - person AruniRC; 04.06.2011
comment
это ссылка на то, где подробно объясняется собственное преобразование. довольно долгий перерыв, но все сомнения теперь покоятся с миром. :) - person AruniRC; 04.06.2011