Новые разработки для 3D-оценки позы человека
Повышение эффективности 3D-оценки позы человека
Это резюме исследования - лишь одно из многих, которые еженедельно распространяются в информационном бюллетене для ученых в области ИИ. Чтобы начать получать еженедельную рассылку, зарегистрируйтесь здесь.
Трехмерная оценка позы человека, представляющая собой процесс оценки трехмерного местоположения человека по изображению или видео, представляет собой важный шаг в задачах компьютерного зрения. Это объясняет стремительный рост его использования для распознавания действий, взаимодействия человека с компьютером, дополненной реальности, видеонаблюдения и автономных технологических приложений.
Однако даже при текущих активных исследованиях в области оценки позы в 3D существует давнее ограничение обобщения, с которым нужно иметь дело. Точная 3D-аннотация требует огромных усилий, а также зависит от определенных условий, включая ограниченные лабораторные условия, ограниченные движения, вариации между наборами данных, внешний вид и многое другое.
Исследователи постоянно прилагают усилия, чтобы устранить проблему. В недавно опубликованной статье они предлагают реализацию обучения со слабым учителем, чтобы обеспечить надежное представление с учетом геометрии для трехмерной оценки позы человека.
Открытие под слабым контролем представления с учетом геометрии для трехмерной оценки позы человека
Подходы со слабым контролем ценны, потому что они помогают уменьшить количество аннотаций, необходимых для достижения желаемого уровня производительности.
В недавнем прошлом обучение со слабым учителем использовалось для обеспечения альтернативного подхода к решению проблемы обобщения для трехмерной оценки позы человека. Но большинство существующих подходов к обучению со слабым учителем зависят от крупномасштабных трехмерных обучающих выборок для инициализации модели.
Исследователи предложили новую слабо контролируемую модель с совершенно другим подходом, нежели существующие фреймворки. Новая модель направлена на открытие надежного трехмерного представления позы человека в скрытом пространстве с учетом геометрии и только с двухмерной аннотацией за счет использования синтеза представлений. Это открывает новое измерение способности изучать представление модели с меньшим количеством аннотаций и более простой сетевой архитектурой, позволяющей обучать оценке позы в монокулярном 3D с меньшим объемом данных.
Оценка модели на наборах данных Human3.6M и MPI-INF-3DHP демонстрирует ее эффективность и гибкость в задачах оценки позы человека в 3D.
Возможное использование и эффекты
Прочитав статью, я могу сказать, что предложенная модель более гибкая, следовательно, ее легче обучать и внедрять. Во-вторых, поскольку он использует только двумерную информацию о ключевых точках и несколько представлений в автокодировщике на этапе обучения, его можно применять для значительного повышения производительности современных трехмерных моделей оценки позы человека.
Подробнее: https://arxiv.org/pdf/1903.08839v1.pdf
Спасибо за прочтение. Прокомментируйте, поделитесь и не забудьте подписаться! Также подписывайтесь на меня в Twitter и LinkedIn. Не забудьте 👏, если вам понравилась эта статья. Ваше здоровье!