Я читаю статью о графическом процессоре AMD и меня смущает конкретный пример. Учитывая модуль SIMD с количеством регистров, сколько волновых фронтов может занимать SIMD, если для них требуется x количество регистров?
В частности, если блок SIMD имеет 16 КБ регистров, которые можно разделить между 1-32 волновыми фронтами. Тогда это означает, что каждый волновой фронт может иметь в среднем 8 регистров (если имеется 32 волновых фронта). Это хорошо.
Затем далее говорится, что существует глобальное ограничение на количество волновых фронтов на SIMD ~ 20,6, что дает каждому волновому фронту 11-12 регистров.
Эта часть затем смущает меня. Далее говорится, что только 2 волновых фронта могут занимать SIMD, если они используют 83 или более регистров. (напоминая, что волновые фронты имеют ширину 64).
По моим подсчетам: 2 * 83 * 64 = 10628 registers
, что намного меньше 16 384 на SIMD. Таким образом, у вас может быть 3 волновых фронта без проблем.
Я читаю статью здесь, если я что-то пропустил . (7-й абзац)