Я использую Intel VTune для профилирования моей программы.
Я использую процессор IVY Bridge.
Все события аппаратной инструкции можно найти здесь:
https://software.intel.com/en-us/node/589933
FP_COMP_OPS_EXE.X87 Количество вычислительных операций FP, выполненных в этом цикле. Количество FADD, FSUB, FCOM, FMUL, целочисленных MUL и IMUL, FDIV, FPREM, FSQRTS, целочисленных DIV и IDIV. Это событие не отличает FADD, используемый в середине трансцендентного потока, от s
FP_COMP_OPS_EXE.X87, кажется, включает целочисленное умножение и целочисленное деление; однако там нет целочисленного сложения и целочисленного вычитания. Я не могу найти эти два вида инструкций на указанном выше веб-сайте.
Может ли кто-нибудь сказать мне, что это за событие, которое подсчитывает инструкции по сложению и вычитанию целых чисел?
add
/sub
инструкций, а не одинаково дешевых, таких какcmp
,and
,xor
, загляните в бинарный инструментарий.add
— одна из самых дешевых инструкций с двумя входами на любом обычном процессоре. На IvB работает на любом порту ALU: задержка 1c, пропускная способность один на 0,333c. Дешевле толькоmov reg,reg
или инструкция по обнулению. См. вики тегов x86. - person Peter Cordes   schedule 04.05.2016