Используйте как встроенные функции SSE2, так и встроенный ассемблер gcc

Я попытался смешать встроенные функции SSE2 и встроенный ассемблер в gcc. Но если я укажу переменную как xmm0 / register в качестве входных данных, тогда в некоторых случаях я получаю ошибку компилятора. Пример:

#include <emmintrin.h>
int main() {
  __m128i test = _mm_setzero_si128(); 
  asm ("pxor %%xmm0, %%xmm0" : : "xmm0" (test) : );
}

При компиляции с gcc версии 4.6.1 я получаю:

>gcc asm_xmm.c
asm_xmm.c: In function ‘main’:
asm_xmm.c:10:3: error: matching constraint references invalid operand number
asm_xmm.c:7:5: error: matching constraint references invalid operand number

Странно то, что в тех же случаях, когда у меня есть другие входные переменные / регистры, он внезапно работает с xmm0 в качестве входных данных, но не с xmm1 и т. Д. И в другом случае я смог указать xmm0-xmm4, но не выше. Немного смущен / расстроен этим: S

Спасибо :)


person Jens Schwarzer    schedule 27.01.2012    source источник


Ответы (1)


Вы должны позволить компилятору выполнять присвоение регистров. Вот пример pshufb (для gcc слишком старого, чтобы иметь tmmintrin для SSSE3):

static inline __m128i __attribute__((always_inline))
_mm_shuffle_epi8(__m128i xmm, __m128i xmm_shuf)
{
    __asm__("pshufb %1, %0" : "+x" (xmm) : "xm" (xmm_shuf));
    return xmm;
}

Обратите внимание на квалификатор "x" в аргументах и ​​просто %0 в самой сборке, где компилятор заменит в выбранном регистре.

Будьте осторожны при использовании правильных модификаторов. "+x" означает, что xmm является как входным, так и выходным параметром. Если вы небрежно используете эти модификаторы (например, используете "=x", что означает вывод только тогда, когда вам нужно "+x"), вы столкнетесь с случаями, когда это иногда работает, а иногда нет.

person Ben Jackson    schedule 27.01.2012