Предложение по алгоритму распознавания объектов с использованием информации о глубине

Недавно я внедрил программное обеспечение для распознавания, следуя методике, описанной в эту статью. Однако мой набор данных также содержит карты глубины, сделанные с помощью OpenNI.

Я хотел бы повысить надежность распознавателя, используя информацию о глубине. Я думал об обучении SVM 1-vs-all, вычисляющих гистограммы отклика лука после извлечения дескрипторов VFH (я адаптировал интерфейс OpenCV DescriptorExtractor для этой задачи). Но дело в том, как я могу объединить эти две вещи, чтобы получить более точные результаты? Может ли кто-нибудь предложить мне стратегию для этого?

P.S. Я бы очень хотел протестировать распознаватель, напрямую показывающий объекты кинекту (а не, как я сейчас делаю, скармливая распознавателю обрезанные изображения).

Pavel Galkin 15.02.2013 источник

comment

Вы уверены, что использование информации о глубине повысит надежность? Документ, который вы цитируете, используя SIFT/Bag of Visual Words в качестве дескриптора, который приведет к аффинно-инвариантной системе, например. вы можете масштабировать/вращать/перемещать объект, и он по-прежнему будет давать в целом похожие дескрипторы и, таким образом, распознавать объект. Если вы используете информацию о глубине и начинаете наклонять объект под разными углами к камере, вы получите совсем другие сигналы. - jcollomosse 11.05.2014

Ответы (1)

arrow_upward
0
arrow_downward

Я предлагаю вам взглянуть на PCL, который представляет собой фреймворк, очень похожий на opencv, только он предназначен для обработки облака точек. Прошло некоторое время с тех пор, как он использовался, но алгоритмы представляют собой другие современные реализации.

http://pointclouds.org/documentation/

Rasmus 11.03.2013

Предложение по алгоритму распознавания объектов с использованием информации о глубине

Ответы (1)

Вопросы по теме