Каков наилучший способ умножить каждую 32-битную запись двух регистров _mm256i
друг на друга?
_mm256_mul_epu32
- это не то, что я ищу, потому что он выдает 64-битные выходные данные. Мне нужен 32-битный результат для каждого 32-битного элемента ввода.
Более того, я уверен, что перемножение двух 32-битных значений не приведет к переполнению.
Спасибо!