Предложение по алгоритму распознавания объектов с использованием информации о глубине

Недавно я внедрил программное обеспечение для распознавания, следуя методике, описанной в эту статью. Однако мой набор данных также содержит карты глубины, сделанные с помощью OpenNI.

Я хотел бы повысить надежность распознавателя, используя информацию о глубине. Я думал об обучении SVM 1-vs-all, вычисляющих гистограммы отклика лука после извлечения дескрипторов VFH (я адаптировал интерфейс OpenCV DescriptorExtractor для этой задачи). Но дело в том, как я могу объединить эти две вещи, чтобы получить более точные результаты? Может ли кто-нибудь предложить мне стратегию для этого?

P.S. Я бы очень хотел протестировать распознаватель, напрямую показывающий объекты кинекту (а не, как я сейчас делаю, скармливая распознавателю обрезанные изображения).


person Pavel Galkin    schedule 15.02.2013    source источник
comment
Вы уверены, что использование информации о глубине повысит надежность? Документ, который вы цитируете, используя SIFT/Bag of Visual Words в качестве дескриптора, который приведет к аффинно-инвариантной системе, например. вы можете масштабировать/вращать/перемещать объект, и он по-прежнему будет давать в целом похожие дескрипторы и, таким образом, распознавать объект. Если вы используете информацию о глубине и начинаете наклонять объект под разными углами к камере, вы получите совсем другие сигналы.   -  person jcollomosse    schedule 11.05.2014


Ответы (1)


Я предлагаю вам взглянуть на PCL, который представляет собой фреймворк, очень похожий на opencv, только он предназначен для обработки облака точек. Прошло некоторое время с тех пор, как он использовался, но алгоритмы представляют собой другие современные реализации.

person Rasmus    schedule 11.03.2013