BFG Repo Cleaner не работает должным образом

Я пытаюсь уменьшить размер большого репо (~ 3,4 ГБ), и bfg-repo-cleaner показался мне идеальным инструментом для его уменьшения.

Я запустил инструмент, как описано в документации, но вижу лишь незначительное уменьшение размера репо. Что особенно удивительно, так это то, что некоторые (но не все) блоги, которые, по словам инструмента, были удалены (deleted-files.txt), все еще находятся в репозитории. Я действительно не хочу начинать возиться с git filter-branch, поэтому любая помощь будет оценена по достоинству.

Я намеренно выбрал агрессивную опцию --no-blob-protection, чтобы максимизировать эффект. Я включил команды, которые я запускал, с усеченным выводом.

git count-objects -vH

count: 0
size: 0 bytes
in-pack: 1616184
packs: 1
size-pack: 3.38 GiB
prune-packable: 0
garbage: 0
size-garbage: 0 bytes

du -rh -d 0

3.4G    .

java -jar ~/Downloads/bfg-1.12.12.jar --strip-blobs-bigger-than 2M --no-blob-protection ./

Scanning packfile for large blobs: 1616184
Scanning packfile for large blobs completed in 33,465 ms.
Found 242 blob ids for large blobs - biggest=497179278 smallest=2098032
Total size (unpacked)=3534794122
Found 0 objects to protect
Found 4965 tag-pointing refs : ...
Found 8519 commit-pointing refs :  ...

Protected commits
-----------------

You're not protecting any commits, which means the BFG will modify the contents of even *current* commits.

This isn't recommended - ideally, if your current commits are dirty, you should fix up your working copy and commit that, check that your build still works, and only then run the BFG to clean up your history.

Cleaning
--------

Found 110364 commits
Cleaning commits:       100% (110364/110364)
Cleaning commits completed in 345,977 ms.

Updating 13483 Refs
-------------------

Ref                                                                                                                  Before     After
----------------------------------------------------------------------------------------------------------------------------------------
...

Updating references:    100% (13483/13483)
...Ref update completed in 15,354 ms.

Commit Tree-Dirt History
------------------------

Earliest                                              Latest
|                                                          |
DDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD

D = dirty commits (file tree fixed)
m = modified commits (commit message or parents changed)
. = clean commits (no changes to file tree)

                        Before     After
-------------------------------------------
First modified commit | 757f8383 | c11fc923
Last dirty commit     | e28d047b | 92b88b05

Deleted files
-------------
...

In total, 418853 object ids were changed. Full details are logged here:

..bfg-report/2016-04-18/10-24-49

git count-objects -vH

count: 419093
size: 1.62 GiB
in-pack: 1616184
packs: 1
size-pack: 3.38 GiB
prune-packable: 0
garbage: 0
size-garbage: 0 bytes

du -rh -d 0

5.1G    .

git reflog expire --expire=now --all && git gc --prune=now --aggressive

Counting objects: 1905870, done.
Delta compression using up to 4 threads.
Compressing objects: 100% (1786570/1786570), done.
Writing objects: 100% (1905870/1905870), done.
Total 1905870 (delta 1274991), reused 482300 (delta 0)
Removing duplicate objects: 100% (256/256), done.
Checking connectivity: 1905870, done.

git count-objects -vH

count: 0
size: 0 bytes
in-pack: 1905870
packs: 1
size-pack: 3.03 GiB
prune-packable: 0
garbage: 0
size-garbage: 0 bytes

глава ..bfg-report/2016-04-18/10-24-49/deleted-files.txt

8afa72875d3013620bb122916bd1ec33a066cbf2 1075353 file_name1.gpx
7656f6464c67f92c48cdbb03ec5a81067c636238 1644202 file_name2.csv
ab68fb197d4479b3b6dec6e85bd5cbaf433a87c5 773236 file_name3.ttf
86c9c0b55ff99c3789bb3ed17daf51bebacba1cb 870631 [email protected]
70c928943feab0a3a1f97b4f752e9dbc1d8f37fa 950305 [email protected]
3862d0da43f5902c75e86ff0dd925d8cca601de3 779356 [email protected]
6effce4b245961cb46e2cf3f4d05bd6c8c182760 908017 [email protected]
1866b1053dd48fc4d0677f03feb4baf2f67b567c 1353732 file_name8.gif
f0d984f00678504fe073110bb6553049e9678755 1350785 file_name9.gif
af877d286b12b9f79560a938375abe04a15ff405 3214192 file_name10.gif

git cat-файл -s 8afa72875d3013620bb122916bd1ec33a066cbf2

1075353

person Zachary Cicala    schedule 18.04.2016    source источник
comment
deleted-files.txt, на который вы смотрите, похоже, находится на пути, отличном от того, который указан в выводе BFG. Возможно, вы просматривали журналы предыдущего запуска BFG несколько дней назад?   -  person kini    schedule 18.04.2016
comment
Да, вы правы, но та же проблема возникает с запуском BFG с сегодняшнего дня (2016-4-18).   -  person Zachary Cicala    schedule 18.04.2016


Ответы (2)


Я понял проблему. У нас было много старых ветвей, которые все еще указывали на деревья с большими пятнами. Удаление их и повторный запуск bfg дало мне сокращение на несколько гигабайт.

Я думал, что флаг --no-blob-protection устранит это состояние.

person Zachary Cicala    schedule 20.04.2016
comment
Поскольку вы нашли решение своей проблемы, вам следует пометить свой ответ как принятый, чтобы показать, что проблема решена. - person Bryce Drew; 06.06.2016
comment
Подтверждаю, это решение. Это спасло мое репо, спасибо! - person JGL; 05.02.2019

Я обнаружил, что повторный запуск bfg с одними и теми же аргументами команды несколько раз приводит к тому, что он находит больше коммитов для очистки. В конце концов он сказал

BFG aborting: No refs to update - no dirty commits found??

В этот момент reflog expire и gc уменьшили размер пакета.

person akatakritos    schedule 16.05.2017