Обычно, чтобы выяснить, чем отличаются два бинарных файла, я использую инструменты diff и hexdump. Но в некоторых ситуациях, если даны два больших бинарных файла одинакового размера, я хотел бы видеть только их количественные различия, такие как количество областей различий, кумулятивная разница.
Пример: 2 файла A и B. Они имеют 2 diff региона, и их совокупная разница составляет 6c-a3 + 6c-11 + 6f-6e + 20-22.
File A = 48 65 6c 6c 6f 2c 20 57
File B = 48 65 a3 11 6e 2c 22 57
|--------| |--|
reg 1 reg 2
Как я могу получить такую информацию, используя стандартные инструменты GNU и Bash, или мне лучше использовать простой скрипт Python? Другая статистика о том, чем отличаются 2 файла, также может быть полезна, но я не знаю, что еще и как можно измерить? Разница в энтропии? Разница в дисперсии?
cmp
, которая у вас уже есть в Linux? en.wikipedia.org/wiki/Cmp_(Unix). Кроме того, если файлы имеют разный размер (или сравниваемые регионы имеют разный размер), каков результат? - person S.Lott   schedule 20.10.201100 ff
иff 00
равна 0. Это задумано? - person Sven Marnach   schedule 20.10.2011