Как удалить большой (>100 МБ) файл из репозитория GitHub и успешно отправить его?

Я нахожусь в той же ситуации, что описана здесь, после непреднамеренного добавления большого файла, который мне не нужен, и выполнения дополнительных коммитов другой работы (не зная, что нажатие завершится неудачно) после непреднамеренного добавления большого файла:

Должен ли я запускать BFG в зеркальном репозитории или в оригинале?


ПОПЫТКА №1 Пытался удалить файл следующим образом:

git rm bigfile
git commit bigfile
git push

Неудачно. Пуш по-прежнему зависал при попытке загрузить большой файл, хотя более поздняя фиксация удалила его:

$ git push

Username for 'https://github.com':
Password for 'https://[email protected]':
Counting objects: 210, done.
Delta compression using up to 4 threads.
Compressing objects: 100% (66/66), done.
Writing objects: 100% (210/210), 5.72 MiB | 1.47 MiB/s, done.
Total 210 (delta 147), reused 203 (delta 140)
remote: error: GH001: Large files detected. You may want to try Git Large File Storage - https://git-lfs.github.com.
remote: error: Trace: eedddea1fcb95663492e16c14fc3a250
remote: error: See http://git.io/iEPt8g for more information.
remote: error: File doc/image.eps is 591.70 MB; this exceeds GitHub's file size limit of 100.00 MB
To https://github.com/traildreaming/myrepo.git
 ! [remote rejected] master -> master (pre-receive hook declined)
error: failed to push some refs to 'https://github.com/traildreaming/myrepo.git'

ПОПЫТКА №2 Пробовал инструкции для https://rtyley.github.io/bfg-repo-cleaner/

Но он не видит мои большие файлы, которые мешают мне сделать толчок:

$ git clone --mirror https://github.com/traildreaming/myrepo.git

Cloning into bare repository 'myrepo.git'...
Username for 'https://github.com':
Password for 'https://[email protected]':
remote: Counting objects: 20471, done.
remote: Total 20471 (delta 0), reused 0 (delta 0), pack-reused 20471
Receiving objects: 100% (20471/20471), 812.92 MiB | 4.00 MiB/s, done.
Resolving deltas: 100% (14464/14464), done.
Checking connectivity... done.

$ cp -fr myrepo.git myrepo.git.bac

note2@Travel-2015-11 /cygdrive/c/Users/note2/Data/git/tmpmirror
$ java -jar ../bfg-1.12.12.jar --strip-blobs-bigger-than 100M myrepo.git

Using repo : C:\Users\note2\Data\git\tmpmirror\myrepo.git

Scanning packfile for large blobs: 20471
Scanning packfile for large blobs completed in 103 ms.
Warning : no large blobs matching criteria found in packfiles - does the repo need to be packed?
Please specify tasks for The BFG :
bfg 1.12.12

ATTTEMPT #3 Попытка этого привела к сообщениям "remote: error:":

$ git clone --mirror ../../myrepo/.git

Cloning into bare repository 'myrepo.git'...
done.

$ java -jar bfg-1.12.12.jar --strip-blobs-bigger-than 100M tmpmirror/myrepo/myrepo.git

Using repo : C:\Users\note2\Data\git\tmpmirror\myrepo\myrepo.git

Scanning packfile for large blobs: 12545
Scanning packfile for large blobs completed in 66 ms.
Found 1 blob ids for large blobs - biggest=620441479 smallest=620441479
Total size (unpacked)=620441479
Found 1322 objects to protect
Found 4 commit-pointing refs : HEAD, refs/heads/master, refs/remotes/origin/HEAD, refs/remotes/origin/master

Protected commits
-----------------

These are your protected commits, and so their contents will NOT be altered:

 * commit b68c0cbc (protected by 'HEAD')

Cleaning
--------

Found 2769 commits
Cleaning commits:       100% (2769/2769)
Cleaning commits completed in 1,485 ms.

Updating 1 Ref
--------------

        Ref                 Before     After
        ---------------------------------------
        refs/heads/master | b68c0cbc | 49823acc

Updating references:    100% (1/1)
...Ref update completed in 18 ms.

Commit Tree-Dirt History
------------------------

        Earliest                                              Latest
        |                                                          |
        ...........................................................D

        D = dirty commits (file tree fixed)
        m = modified commits (commit message or parents changed)
        . = clean commits (no changes to file tree)

                                Before     After
        -------------------------------------------
        First modified commit | 0ef7f866 | e3d74aee
        Last dirty commit     | 338d2b46 | 01ca7b80

Deleted files
-------------

        Filename                     Git id
        ------------------------------------------------
        image.eps | e12fe50b (591.7 MB)


In total, 50 object ids were changed. Full details are logged here:

        C:\Users\note2\Data\git\tmpmirror\myrepo\myrepo.git.bfg-report\2016-06-11\15-59-30

BFG run is complete! When ready, run: git reflog expire --expire=now --all && git gc --prune=now --aggressive

$ git reflog expire --expire=now --all && git gc --prune=now --aggressive

Counting objects: 20681, done.
Delta compression using up to 4 threads.
Compressing objects: 100% (20114/20114), done.
Writing objects: 100% (20681/20681), done.
Total 20681 (delta 14625), reused 3226 (delta 0)
Removing duplicate objects: 100% (256/256), done.

$ git push

Counting objects: 210, done.
Delta compression using up to 4 threads.
Compressing objects: 100% (82/82), done.
Writing objects: 100% (210/210), 1.81 MiB | 0 bytes/s, done.
Total 210 (delta 147), reused 185 (delta 124)
remote: error: refusing to update checked out branch: refs/heads/master
remote: error: By default, updating the current branch in a non-bare repository
remote: error: is denied, because it will make the index and work tree inconsistent
remote: error: with what you pushed, and will require 'git reset --hard' to match
remote: error: the work tree to HEAD.
remote: error:
remote: error: You can set 'receive.denyCurrentBranch' configuration variable to
remote: error: 'ignore' or 'warn' in the remote repository to allow pushing into
remote: error: its current branch; however, this is not recommended unless you
remote: error: arranged to update its work tree to match what you pushed in some
remote: error: other way.
remote: error:
remote: error: To squelch this message and still keep the default behaviour, set
remote: error: 'receive.denyCurrentBranch' configuration variable to 'refuse'.
To /cygdrive/c/Users/note2/Data/git/tmpmirror/myrepo/../../myrepo/.git
 ! [remote rejected] master -> master (branch is currently checked out)
error: failed to push some refs to '/cygdrive/c/Users/note2/Data/git/tmpmirror/myrepo/../../myrepo/.git'

person TrailDreaming    schedule 11.06.2016    source источник
comment
Я думаю, что сейчас это работает. Я не должен был останавливаться на попытке № 3 в git push, я попробовал то, что было предложено в ответе stackoverflow, на который я ссылался, который должен был сделать: git push github.com/traildreaming/myrepo, а не git push. Затем я перешел в пустой каталог и клонировал свое репо. Человек в другом ответе сказал, что вещи пропали. Я не уверен, что вещи еще не пропали. На первый взгляд все в порядке. Обновлю с подробностями, если нет.   -  person TrailDreaming    schedule 12.06.2016


Ответы (2)


Даже если вы удалили файл в последнем коммите, у вас все еще есть его копия в вашей истории. Я думаю, вы захотите полностью удалить его из git.

Вероятно, вы захотите перебазировать его. Чтобы узнать, когда вы представили его, вы можете сделать:

git log --reverse -n1 doc/image.eps

Затем скопируйте SHA, который он вам дает, и выполните интерактивную перебазировку:

git rebase -i sha~1

Сохраните ~1 в приведенной выше команде, но замените sha фактическим SHA из более раннего вывода команды. Если приведенная выше команда не работает, вам может потребоваться установить EDITOR, например:

EDITOR=vim git rebase -i sha~1

Замените vim любым удобным для вас редактором командной строки (emacs, nano и т. д.). Вы можете заставить его работать с редакторами графического интерфейса, такими как atom, но вам может потребоваться передать дополнительные аргументы, чтобы заставить процесс ждать, пока вы не закроете окно. Если вы используете atom, вы можете запустить:

EDITOR="atom --wait" git rebase -i sha~1

Это перенесет вас в прошлое. В самой первой строке будет pick. Вы захотите изменить это на edit. Затем сохраните и выйдите из редактора. Не изменяйте никакие другие picks.

Это вернет вас к фиксации, которая представила большой файл. Теперь вы можете удалить его из git:

git rm doc/image.eps && git commit --amend

Затем продолжите перебазирование:

git rebase --continue

Если это дойдет до конца, то все готово. Вы должны быть в состоянии git push. Однако, если это не так, возможно, вы обновили образ в более позднем коммите. Вы захотите делать то же самое git rm doc/image.eps && git commit --amend && git rebase --continue, что мы делали выше, каждый раз, когда он останавливается.

Я допускаю довольно много вещей, поэтому надеюсь, что вы достаточно хорошо разбираетесь в git, редакторах и командной строке, чтобы использовать эту информацию.

P.S. вероятно, есть гораздо более короткий и лаконичный способ сделать это, но, поскольку вы задаете этот вопрос, я предполагаю, что вам не нужна волшебная команда git, которая сама по себе разорвет вашу историю. Итак, сначала попробуем пошагово.

person Zach Dennis    schedule 11.06.2016

Вот как я заставил его работать после того, как «git push» застрял из-за добавления и фиксации большого файла, а затем продолжения фиксации с другой работой, находясь вдали от Интернета:

Я скачал bfg*jar с:
https://rtyley.github.io/bfg-repo-cleaner/

cd tmpmirror; mkdir myrepo; cd myrepo; git clone --mirror ../../myrepo/.git
java -jar bfg-1.12.12.jar --strip-blobs-bigger-than 100M myrepo.git
cd myrepo.git; git reflog expire --expire=now --all && git gc --prune=now --aggressive
git push https://github.com/traildreaming/myrepo
cd ../../..
mv myrepo myrepo_old
git clone https://github.com/traildreaming/myrepo
cd myrepo

Если вы получили это сообщение, попробуйте выполнить дополнительные шаги, описанные ниже.

$ java -jar ../../bfg-1.12.13.jar --strip-blobs-bigger-than 100M myrepo.git

Using repo : [DIR]\tmpmirror\myrepo\myrepo.git

Scanning packfile for large blobs: 20681
Scanning packfile for large blobs completed in 135 ms.
Warning : no large blobs matching criteria found in packfiles - does the         repo need to be packed?
Please specify tasks for The BFG :
bfg 1.12.13
Usage: bfg [options] [<repo>]

  -b <size> | --strip-blobs-bigger-than <size>
        strip blobs bigger than X (eg '128K', '1M', etc)

```

cd tmpmirror; mkdir myrepo; cd myrepo; git clone --mirror ../../myrepo/.git
cd myrepo.git; git repack; cd ..
java -jar bfg-1.12.12.jar --strip-blobs-bigger-than 100M myrepo.git
cd myrepo.git; git reflog expire --expire=now --all && git gc --prune=now --aggressive
git push https://github.com/traildreaming/myrepo
cd ../../..
mv myrepo myrepo_old
git clone https://github.com/traildreaming/myrepo
cd myrepo

А затем продолжите работу во вновь клонированном репо. Благодаря совету на Am Я должен запустить BFG на зеркальном репо или на оригинале? использовать «git push https://github.com/traildreaming/myrepo», а не «git push».

person TrailDreaming    schedule 12.06.2016