Могу ли я выполнить предварительную выборку определенных данных для определенного уровня кэша в ядре CUDA?

Я понимаю, что графические процессоры Fermi поддерживают предварительную выборку в кэш L1 или L2. Однако в справочном руководстве CUDA я ничего не могу найти об этом.

Долги CUDA позволяют моему коду ядра предварительно выбирать определенные данные для определенного уровня кеша?


person dalibocai    schedule 21.01.2011    source источник


Ответы (1)


Ну, не на уровне инструкций, но подробная информация о предварительной выборке в графических процессорах здесь:

Многопоточные механизмы предварительной выборки для приложений GPGPU
(статья в симпозиум ACM по микроархитектуре 2010 г.)

Справку по инструкциям можно найти в справочнике PTX ISA от nVIDIA; соответствующие инструкции приведены ниже: ">prefetch и prefetchu.

person kerem    schedule 09.02.2011
comment
Я ценю информацию. Жаль, что CUDA не предоставляет инструкции по предварительной выборке. - person dalibocai; 14.02.2011
comment
Обновил ссылки... но актуален ли этот документ в наши дни (т.е. для микроархитектур Maxwell и Pascal?) - person einpoklum; 20.03.2017