Новые разработки для 3D-оценки позы человека

Повышение эффективности 3D-оценки позы человека

Это резюме исследования - лишь одно из многих, которые еженедельно распространяются в информационном бюллетене для ученых в области ИИ. Чтобы начать получать еженедельную рассылку, зарегистрируйтесь здесь.

Трехмерная оценка позы человека, представляющая собой процесс оценки трехмерного местоположения человека по изображению или видео, представляет собой важный шаг в задачах компьютерного зрения. Это объясняет стремительный рост его использования для распознавания действий, взаимодействия человека с компьютером, дополненной реальности, видеонаблюдения и автономных технологических приложений.

Однако даже при текущих активных исследованиях в области оценки позы в 3D существует давнее ограничение обобщения, с которым нужно иметь дело. Точная 3D-аннотация требует огромных усилий, а также зависит от определенных условий, включая ограниченные лабораторные условия, ограниченные движения, вариации между наборами данных, внешний вид и многое другое.

Исследователи постоянно прилагают усилия, чтобы устранить проблему. В недавно опубликованной статье они предлагают реализацию обучения со слабым учителем, чтобы обеспечить надежное представление с учетом геометрии для трехмерной оценки позы человека.

Открытие под слабым контролем представления с учетом геометрии для трехмерной оценки позы человека

Подходы со слабым контролем ценны, потому что они помогают уменьшить количество аннотаций, необходимых для достижения желаемого уровня производительности.

В недавнем прошлом обучение со слабым учителем использовалось для обеспечения альтернативного подхода к решению проблемы обобщения для трехмерной оценки позы человека. Но большинство существующих подходов к обучению со слабым учителем зависят от крупномасштабных трехмерных обучающих выборок для инициализации модели.

Исследователи предложили новую слабо контролируемую модель с совершенно другим подходом, нежели существующие фреймворки. Новая модель направлена ​​на открытие надежного трехмерного представления позы человека в скрытом пространстве с учетом геометрии и только с двухмерной аннотацией за счет использования синтеза представлений. Это открывает новое измерение способности изучать представление модели с меньшим количеством аннотаций и более простой сетевой архитектурой, позволяющей обучать оценке позы в монокулярном 3D с меньшим объемом данных.

Оценка модели на наборах данных Human3.6M и MPI-INF-3DHP демонстрирует ее эффективность и гибкость в задачах оценки позы человека в 3D.

Возможное использование и эффекты

Прочитав статью, я могу сказать, что предложенная модель более гибкая, следовательно, ее легче обучать и внедрять. Во-вторых, поскольку он использует только двумерную информацию о ключевых точках и несколько представлений в автокодировщике на этапе обучения, его можно применять для значительного повышения производительности современных трехмерных моделей оценки позы человека.

Подробнее: https://arxiv.org/pdf/1903.08839v1.pdf

Спасибо за прочтение. Прокомментируйте, поделитесь и не забудьте подписаться! Также подписывайтесь на меня в Twitter и LinkedIn. Не забудьте 👏, если вам понравилась эта статья. Ваше здоровье!