Я провел несколько месяцев, изучая и экспериментируя с процессом обнаружения, описания и сопоставления ключевых точек. В последнее время я также увлекаюсь концепциями дополненной реальности, а именно «безмаркерным» распознаванием и оценкой позы.
К счастью, я обнаружил, что предыдущие концепции все еще широко используются в этой обстановке. Общий конвейер для создания базовой дополненной реальности выглядит следующим образом, не вдаваясь в подробности о каждом необходимом алгоритме:
При захвате видео в каждом кадре...
- Получите несколько ключевых точек и создайте их дескрипторы
- Найдите совпадения между этими точками и точками внутри ранее сохраненного «маркера» (например, фотографии).
- Если спичек достаточно, оцените позу видимого предмета и поиграйте с ним.
То есть очень упрощенная процедура, используемая, например, этим студенческим(?) проектом.
Теперь вопрос: в ходе моих личных исследований я также нашел еще один метод, называемый «оптическим потоком». Я еще в начале изучения, но сначала хотелось бы узнать, насколько он отличается от предыдущего метода. Конкретно:
- Какие основные концепции лежат в его основе? Использует ли он «подмножество» алгоритмов, примерно описанных ранее?
- Каковы основные различия с точки зрения вычислительных затрат, производительности, стабильности и точности? (Я знаю, что это может быть слишком общий вопрос)
- Какой из них больше используется в коммерческих инструментах дополненной реальности? (джунайо, лаяр, ...)
Спасибо за сотрудничество.