Преобразователь иерархического зрения с использованием сдвинутых окон

В 2021 году Microsoft анонсировала новый Vision Transformer под названием Swin Transformer, который может выступать в качестве основы для задач компьютерного зрения, таких как классификация изображений, обнаружение объектов и семантическая сегментация.

Слово Swin означает Sсдвинутые окна, которые обеспечивают Трансформеру иерархическое видение, то есть…