Вопросы по теме 'compute-capability'
Свойства устройства CUDA и вычислительные возможности при компиляции
Предположим, у меня есть код, который позволяет пользователю передать threads_per_block для вызова ядра. Затем я хочу проверить, действителен ли ввод (например, ‹=512 для вычислительных возможностей CC ‹2.0 и 1024 для CC >=2.0).
Теперь мне...
637 просмотров
schedule
14.11.2022
Почему nvlink предупреждает меня об отсутствии объектного кода sm_20 (вычислительные возможности 2.0)?
Я работаю с CUDA 6.5 на машине с картой GTX Titan (вычислительная способность 3.5). Я создаю свой код только с помощью -gencode=arch=compute_30,code=sm_30 -gencode=arch=compute_35,code=sm_35 , и когда я связываю свой двоичный файл, nvlink говорит:...
704 просмотров
schedule
19.07.2023
Поведение кэша в Compute Capability 7.5
Это мои предположения:
Существует два типа загрузки: кэшированная и некэшируемая. В первом трафик идет через L1 и L2, а во втором трафик идет только через L2.
Поведением по умолчанию в Compute Capability 6.x и 7.x является кэшированный доступ....
148 просмотров
schedule
22.11.2022