У меня есть программа, основная структура которой следующая:
<c language headers>
main() {
some malloc() allocations and file reads into these buffers
call to an assembly language routine that needs to be optimized to the maximum
write back the output of to files and do free()
exit()
}
Программа на языке ассемблера по существу вычисляет контрольную сумму данных в буфере, и я намерен оптимизировать ее до абсолютного максимума. Он не выполняет никаких системных вызовов или вызовов библиотечных функций.
Я только что установил пакет Intel vTune Amplifier XE в VS 2015.
Как указать vtune, чтобы он сосредоточился строго на рутинной части языка ассемблера и пропустил весь анализ подготовительных частей языка «C». Кажется, я получаю все накопленные данные, такие как INSTRUCTION COUNT или CPI и т. Д. Возможно ли получить данные только для циклов и ветвей в подпрограмме языка ассемблера. Если да, то подскажите, как мне это сделать.
Спасибо