Как следует из названия, я работаю над небольшим личным исследованием параллельных методов компьютерного зрения. Используя CUDA, я пытаюсь реализовать GPGPU-версию преобразования Хафа. Единственная проблема, с которой я столкнулся, это процесс голосования. Я вызываю atomicAdd(), чтобы предотвратить несколько одновременных операций записи, и, похоже, я не получаю слишком много эффективности производительности. Я искал в Интернете, но не нашел способа заметно повысить производительность процесса голосования.
Любая помощь, которую вы могли бы предоставить в отношении процесса голосования, будет принята с благодарностью.