Я понимаю, что графические процессоры Fermi поддерживают предварительную выборку в кэш L1 или L2. Однако в справочном руководстве CUDA я ничего не могу найти об этом.
Долги CUDA позволяют моему коду ядра предварительно выбирать определенные данные для определенного уровня кеша?