Недавно я внедрил программное обеспечение для распознавания, следуя методике, описанной в эту статью. Однако мой набор данных также содержит карты глубины, сделанные с помощью OpenNI.
Я хотел бы повысить надежность распознавателя, используя информацию о глубине. Я думал об обучении SVM 1-vs-all, вычисляющих гистограммы отклика лука после извлечения дескрипторов VFH (я адаптировал интерфейс OpenCV DescriptorExtractor для этой задачи). Но дело в том, как я могу объединить эти две вещи, чтобы получить более точные результаты? Может ли кто-нибудь предложить мне стратегию для этого?
P.S. Я бы очень хотел протестировать распознаватель, напрямую показывающий объекты кинекту (а не, как я сейчас делаю, скармливая распознавателю обрезанные изображения).