Вопросы по теме 'directcompute'

Пример кода для шифрования/дешифрования AES с использованием DirectCompute
может ли кто-нибудь узнать о реализации шифрования/дешифрования AES (любого типа) с использованием DirectCompute (включая исходный код HLSL)? Я прочитал несколько статей, обсуждающих AES на графическом процессоре, и они, как правило, ссылаются либо...
671 просмотров
schedule 12.01.2023

Создайте представление R32_UINT из ресурса R8G8B8A8_UNORM.
Мне нужно выполнить редактирование изображений на месте с помощью DirectCompute — например: http://msdn.microsoft.com/en-us/library/ff728749%28v=vs.85%29.aspx Мой резервный буфер — R8G8B8A8_UNORM, и мне нужно создать БПЛА формата R32_UINT, чтобы...
1583 просмотров
schedule 08.01.2023

directcompute hlsl numthreads?
Поскольку вы уже определяете группы потоков, которые будут выполняться при отправке вычислительного шейдера, что означают числа внутри файла шейдера? пример: [numthreads (1, 1, 1)]
645 просмотров
schedule 07.05.2023

Потоки на GPU
Я использую DirectCompute для общих вычислений на GPU. В настоящее время я пытаюсь работать с текстурой с разрешением 1920x1080. У меня есть Dispatch(2, 1080, 1) и numthreads(960, 1, 1), которые по моим расчетам точно покрывают мое изображение с...
194 просмотров

Настройка оптимального числа потоков DirectCompute
Недавно я играл с вычислительными шейдерами и пытаюсь определить наиболее оптимальный способ настройки [numthreads(x,y,z)] и диспетчеризации вызовов. Мое демонстрационное окно 800x600 и я запускаю 1 поток на пиксель. Я выполняю модификации...
3101 просмотров

D3D12 Использовать поверхность заднего буфера в качестве вида с неупорядоченным доступом (БПЛА)
Я делаю простой трассировщик лучей для школьного проекта, где предполагается, что вычислительный шейдер будет использоваться для затенения треугольника или другого примитива. Для этого я хотел бы записать на поверхность обратного буфера...
877 просмотров

Можно ли с помощью вычислительного шейдера HLSL записать на адрес, не совпадающий с 4 байтами?
Я пытаюсь преобразовать существующее ядро ​​OpenCL в вычислительный шейдер HLSL. Ядро OpenCL делает выборку каждого пикселя в текстуре RGBA и записывает каждый цветовой канал в плотно упакованный массив. По сути, мне нужно записать в плотно...
531 просмотров

Устройству потребовалось неоправданно много времени для выполнения своих команд.
Я портирую код C на HLSL (вычислительный шейдер). Компилятор без ума от одного из циклов for. Во время выполнения драйвер устройства отображения обнаруживает неоправданное количество времени для выполнения кода. Вот частичный исходный код с...
332 просмотров
schedule 11.03.2023

предупреждение X4000: использование потенциально неинициализированной переменной
Компилятор HLSL выдает сообщение об ошибке " предупреждение X4000: использование потенциально неинициализированной переменной " со следующим кодом: float4 GetPixelColorFromRawImage( in ByteAddressBuffer Source, in uint2...
436 просмотров
schedule 04.04.2024

Потоки деформации не синхронизированы с SIMD
Я просматриваю параллельное сокращение пример от Nvidia . Если tid < 32 , то все потоки должны находиться в одном и том же варпе, поэтому предполагается, что инструкции синхронизированы с SIMD, поэтому мы можем предположить, что sdata[tid] +=...
59 просмотров