Вопросы по теме 'compute-capability'

Свойства устройства CUDA и вычислительные возможности при компиляции
Предположим, у меня есть код, который позволяет пользователю передать threads_per_block для вызова ядра. Затем я хочу проверить, действителен ли ввод (например, ‹=512 для вычислительных возможностей CC ‹2.0 и 1024 для CC >=2.0). Теперь мне...
637 просмотров
schedule 14.11.2022

Почему nvlink предупреждает меня об отсутствии объектного кода sm_20 (вычислительные возможности 2.0)?
Я работаю с CUDA 6.5 на машине с картой GTX Titan (вычислительная способность 3.5). Я создаю свой код только с помощью -gencode=arch=compute_30,code=sm_30 -gencode=arch=compute_35,code=sm_35 , и когда я связываю свой двоичный файл, nvlink говорит:...
704 просмотров
schedule 19.07.2023

Поведение кэша в Compute Capability 7.5
Это мои предположения: Существует два типа загрузки: кэшированная и некэшируемая. В первом трафик идет через L1 и L2, а во втором трафик идет только через L2. Поведением по умолчанию в Compute Capability 6.x и 7.x является кэшированный доступ....
148 просмотров