Bonjour,

On Tue, 11 Jan 2005 13:37:09 +0100, Basile STARYNKEVITCH
<[EMAIL PROTECTED]> wrote:

[...]

> 
> Une solution approximative serait de calculer le md5sum de chaque
> fichier, puis d'y detecter les doublons

Comment je calcul un md5 r�cursif sur l'arbor�sence du DD ?
J'ai des fichiers identique qui ont des nom diff�rent, quelle solution
pour cela ?
Mais d�j� avec cette solution j'aurais tri� 90 % des fichiers !

> 
>   find * -type f -exec md5sum '{}' \; | sort > /tmp/listemd5
> 
> ensuite, dans la liste (tri�e) ainsi obtenue, cherchez les lignes
> consecutives ayant la m�me clef, par exemple
>   awk '{if ($1==prec) print $0; prec=$1}' /tmp/listemd5
> 
> Stricto sensu, ca vous detecte les collisions de clefs md5. Mais en
> pratique, celles-ci sont tellement rares que vous ne trouverez que les
> fichiers aux contenus identiques.
> 

Je veux bien une solution "power-user" pour comparer, l'extention du
fichier et sa taille .

Merci

Philippe

Répondre à