Объяснение слабого классификатора Виолы Джонса

Я пытался понять статью Виолы и Джонса о распознавании лиц. Я не совсем уверен, что означают параметры этого уравнения из раздела 3.

h(x, f, p, theta) = 1 ; if pf(x) < p theta

Я понял, что функция (f) — это значение, полученное путем запуска любой из этих 5 основных функций, описанных в начале статьи, над интегральным изображением x.

Чего я не могу правильно понять, так это порога «тета» и полярности «р». Означает ли это p положительное изображение и отрицательное изображение и может иметь значение +1 или -1? И как мне рассчитать тета. Это уравнение жизненно важно для повышения секции, поэтому я не могу идти дальше. Пожалуйста, помогите, если я достаточно ясно выражаюсь.


person Sgt. Pepper    schedule 27.11.2013    source источник


Ответы (1)


Вы должны понимать, что слабый классификатор h использует функцию Хаара f для классификации подокна изображения x. Параметр p, если он равен -1, просто вызывает инверсию знака сравнения условия if pf(x) < p theta.

Параметр theta — это просто порог. Скажем, например, что p = +1. Если f(x) < theta, то h(x, f, p, theta) = +1, т.е. слабый классификатор считает x гранью.

person Ramiro    schedule 29.11.2013
comment
Спасибо. Это p инвертируется где-то в потоке кода или выбирается пользователем? Пожалуйста, не возражайте, если это покажется отсталым вопросом. И как мне получить theta? - person Sgt. Pepper; 02.12.2013
comment
В «классическом» подходе для этого и p, и theta устанавливаются одновременно для каждого вейвлета Хаара на каждой итерации Adaboost. Я разместил несколько полезных ссылок в этом другом вопросе. - person Ramiro; 02.12.2013