Вопросы по теме 'directcompute'
Пример кода для шифрования/дешифрования AES с использованием DirectCompute
может ли кто-нибудь узнать о реализации шифрования/дешифрования AES (любого типа) с использованием DirectCompute (включая исходный код HLSL)?
Я прочитал несколько статей, обсуждающих AES на графическом процессоре, и они, как правило, ссылаются либо...
671 просмотров
schedule
12.01.2023
Создайте представление R32_UINT из ресурса R8G8B8A8_UNORM.
Мне нужно выполнить редактирование изображений на месте с помощью DirectCompute — например: http://msdn.microsoft.com/en-us/library/ff728749%28v=vs.85%29.aspx
Мой резервный буфер — R8G8B8A8_UNORM, и мне нужно создать БПЛА формата R32_UINT, чтобы...
1583 просмотров
schedule
08.01.2023
directcompute hlsl numthreads?
Поскольку вы уже определяете группы потоков, которые будут выполняться при отправке вычислительного шейдера, что означают числа внутри файла шейдера? пример: [numthreads (1, 1, 1)]
645 просмотров
schedule
07.05.2023
Потоки на GPU
Я использую DirectCompute для общих вычислений на GPU. В настоящее время я пытаюсь работать с текстурой с разрешением 1920x1080. У меня есть Dispatch(2, 1080, 1) и numthreads(960, 1, 1), которые по моим расчетам точно покрывают мое изображение с...
194 просмотров
schedule
23.03.2023
Настройка оптимального числа потоков DirectCompute
Недавно я играл с вычислительными шейдерами и пытаюсь определить наиболее оптимальный способ настройки [numthreads(x,y,z)] и диспетчеризации вызовов. Мое демонстрационное окно 800x600 и я запускаю 1 поток на пиксель. Я выполняю модификации...
3101 просмотров
schedule
24.09.2022
D3D12 Использовать поверхность заднего буфера в качестве вида с неупорядоченным доступом (БПЛА)
Я делаю простой трассировщик лучей для школьного проекта, где предполагается, что вычислительный шейдер будет использоваться для затенения треугольника или другого примитива. Для этого я хотел бы записать на поверхность обратного буфера...
877 просмотров
schedule
02.04.2024
Можно ли с помощью вычислительного шейдера HLSL записать на адрес, не совпадающий с 4 байтами?
Я пытаюсь преобразовать существующее ядро OpenCL в вычислительный шейдер HLSL.
Ядро OpenCL делает выборку каждого пикселя в текстуре RGBA и записывает каждый цветовой канал в плотно упакованный массив.
По сути, мне нужно записать в плотно...
531 просмотров
schedule
27.03.2023
Устройству потребовалось неоправданно много времени для выполнения своих команд.
Я портирую код C на HLSL (вычислительный шейдер). Компилятор без ума от одного из циклов for. Во время выполнения драйвер устройства отображения обнаруживает неоправданное количество времени для выполнения кода.
Вот частичный исходный код с...
332 просмотров
schedule
11.03.2023
предупреждение X4000: использование потенциально неинициализированной переменной
Компилятор HLSL выдает сообщение об ошибке " предупреждение X4000: использование потенциально неинициализированной переменной " со следующим кодом:
float4 GetPixelColorFromRawImage(
in ByteAddressBuffer Source,
in uint2...
436 просмотров
schedule
04.04.2024
Потоки деформации не синхронизированы с SIMD
Я просматриваю параллельное сокращение пример от Nvidia . Если tid < 32 , то все потоки должны находиться в одном и том же варпе, поэтому предполагается, что инструкции синхронизированы с SIMD, поэтому мы можем предположить, что sdata[tid] +=...
59 просмотров
schedule
21.01.2023