web-dev-qa-db-fra.com

Git: affiche la différence totale de taille de fichier entre deux validations?

Est-il possible d'afficher la différence de taille totale de fichier entre deux validations? Quelque chose comme:

$ git file-size-diff 7f3219 bad418 # I wish this worked :)
-1234 bytes

J'ai essayé:

$ git diff --patch-with-stat

Et cela montre la différence de taille de fichier pour chaque binaire fichier dans le diff - mais pas pour les fichiers texte, et non la différence de taille totale du fichier.

Des idées?

69
Mathias Bynens

git cat-file -s affichera la taille en octets d'un objet dans git. git diff-tree peut vous indiquer les différences entre un arbre et un autre.

Mettre cela ensemble dans un script appelé git-file-size-diff situé quelque part sur votre CHEMIN vous donnera la possibilité d'appeler git file-size-diff <tree-ish> <tree-ish>. Nous pouvons essayer quelque chose comme ceci:

#!/bin/bash
USAGE='[--cached] [<rev-list-options>...]

Show file size changes between two commits or the index and a commit.'

. "$(git --exec-path)/git-sh-setup"
args=$(git rev-parse --sq "$@")
[ -n "$args" ] || usage
cmd="diff-tree -r"
[[ $args =~ "--cached" ]] && cmd="diff-index"
eval "git $cmd $args" | {
  total=0
  while read A B C D M P
  do
    case $M in
      M) bytes=$(( $(git cat-file -s $D) - $(git cat-file -s $C) )) ;;
      A) bytes=$(git cat-file -s $D) ;;
      D) bytes=-$(git cat-file -s $C) ;;
      *)
        echo >&2 warning: unhandled mode $M in \"$A $B $C $D $M $P\"
        continue
        ;;
    esac
    total=$(( $total + $bytes ))
    printf '%d\t%s\n' $bytes "$P"
  done
  echo total $total
}

En cours d'utilisation, cela ressemble à ceci:

$ git file-size-diff HEAD~850..HEAD~845
-234   Documentation/RelNotes/1.7.7.txt
112    Documentation/git.txt
-4     GIT-VERSION-GEN
43     builtin/grep.c
42     diff-lib.c
594    git-rebase--interactive.sh
381    t/t3404-rebase-interactive.sh
114    t/test-lib.sh
743    tree-walk.c
28     tree-walk.h
67     unpack-trees.c
28     unpack-trees.h
total 1914

En utilisant git-rev-parse il doit accepter toutes les méthodes habituelles de spécification des plages de validation.

EDIT: mis à jour pour enregistrer le total cumulé. Notez que bash exécute le tout en lecture dans un sous-shell, d'où les accolades supplémentaires pour éviter de perdre le total lorsque le sous-shell se termine.

EDIT: ajout de la prise en charge de la comparaison de l'index avec une autre arborescence en utilisant un --cached argument pour appeler git diff-index au lieu de git diff-tree. par exemple:

$ git file-size-diff --cached master
-570    Makefile
-134    git-gui.sh
-1  lib/browser.tcl
931 lib/commit.tcl
18  lib/index.tcl
total 244
81
patthoyts

Vous pouvez diriger la sortie de

git show some-ref:some-path-to-file | wc -c
git show some-other-ref:some-path-to-file | wc -c

et comparez les 2 nombres.

18
Adam Dymitruk

J'ai fait un script bash pour comparer les branches/commits, etc. par la taille réelle du fichier/contenu. Il peut être trouvé sur https://github.com/matthiaskrgr/gitdiffbinstat et détecte également les renommages de fichiers.

3
matthiaskrgr

Développer sur réponse de matthiaskrgr , https://github.com/matthiaskrgr/gitdiffbinstat peut être utilisé comme les autres scripts:

gitdiffbinstat.sh HEAD..HEAD~4

Imo, cela fonctionne vraiment bien, beaucoup plus rapidement que toute autre chose publiée ici. Exemple de sortie:

$ gitdiffbinstat.sh HEAD~6..HEAD~7
 HEAD~6..HEAD~7
 704a8b56161d8c69bfaf0c3e6be27a68f27453a6..40a8563d082143d81e622c675de1ea46db706f22
 Recursively getting stat for path "./c/data/gitrepo" from repo root......
 105 files changed in total
  3 text files changed, 16 insertions(+), 16 deletions(-) => [±0 lines]
  102 binary files changed 40374331 b (38 Mb) -> 39000258 b (37 Mb) => [-1374073 b (-1 Mb)]
   0 binary files added, 3 binary files removed, 99 binary files modified => [-3 files]
    0 b  added in new files, 777588 b (759 kb) removed => [-777588 b (-759 kb)]
    file modifications: 39596743 b (37 Mb) -> 39000258 b (37 Mb) => [-596485 b (-582 kb)]
    / ==>  [-1374073 b (-1 Mb)]

Le répertoire de sortie est génial avec ./c/data ... car/c est en fait la racine du système de fichiers.

3
guest

Un commentaire sur le script: git-file-size-diff, suggéré par patthoyts. Le script est très utile, cependant, j'ai trouvé deux problèmes:

  1. Lorsque quelqu'un modifie les autorisations sur le fichier, git renvoie un autre type dans l'instruction case:

    T) echo >&2 "Skipping change of type"
    continue ;;
    
  2. Si une valeur sha-1 n'existe plus (pour une raison quelconque), le script se bloque. Vous devez valider le sha avant d'obtenir la taille du fichier:

    $(git cat-file -e $D) if [ "$?" = 1 ]; then continue; fi

La déclaration de cas complète ressemblera alors à ceci:

case $M in
      M) $(git cat-file -e $D)
         if [ "$?" = 1 ]; then continue; fi
         $(git cat-file -e $C)
         if [ "$?" = 1 ]; then continue; fi
         bytes=$(( $(git cat-file -s $D) - $(git cat-file -s $C) )) ;;
      A) $(git cat-file -e $D)
         if [ "$?" = 1 ]; then continue; fi
         bytes=$(git cat-file -s $D) ;;
      D) $(git cat-file -e $C)
         if [ "$?" = 1 ]; then continue; fi
         bytes=-$(git cat-file -s $C) ;;
      T) echo >&2 "Skipping change of type"
         continue ;;
      *)
        echo >&2 warning: unhandled mode $M in \"$A $B $C $D $M $P\"
        continue
        ;;
    esac
2
Richard Nilsson