Jan 21 2009
Trouver les fichiers doubles avec un script shell
Ce script shell recherche les fichiers doubles dans un répertoire donné en comparant leur checksum (md5). C’est le contenu qui est comparé et qui est strictement identique, plutôt que le nom de fichier ou la date de création.
Ceci est utile, notamment pour suprimer les fichiers dupliqués de grande taille. L’option -size de la commande ‘Find’ peut être intéressante pour accélérer l’exécution et trouver les plus gros fichiers.
admin@fileserver$ find /usr/bin -type f -print0 | xargs -0 -n1 md5sum | sort -k 1,32 | uniq -w 32 -d --all-repeated=separate | sed -e 's/^[0-9a-f]*\ *//;' /usr/bin/c2ph /usr/bin/pstruct /usr/bin/pgrep /usr/bin/pkill /usr/bin/perl /usr/bin/perl5.8.8 /usr/bin/suidperl ...
Il est possible de l’exécuter sur des systèmes de fichiers Windows montés avec Samba.