Re: Ordnung in Datensalat bringen

2004-07-08 Diskussionsfäden Christoph Lffler
Hallo,
Markus Meyer wrote:
Christoph Lffler wrote:
Auch mglich wre ein chmod -R u+rwX,g-rwxst,o-rwxst /home/user
siehe `man chmod`, das grosse X setzt das nur bei Verzeichnissen.

Aber bitte Obacht bei 'chmod -R'. Wenn man symbolische Links in dem
Verzeichnis hat, dann folgt 'chmod' diesem. Von daher ist eigentlich immer
die 'find . -exec chmod' Methode vorzuziehen. Aber das ist ja bei Daten,
die vom Fenster rueberkopiert wurden eher nicht der Fall ;)
Ok, was stimmt jetzt?
aus 'man chmod'
chmod never changes the permissions of symbolic links; the chmod
system call cannot change their permissions. This is not a problem 
since the permissions of symbolic links are never used. However, for 
each symbolic link listed on the command line, chmod changes the 
permissions of the pointed-to file. In contrast, chmod ignores 
symbolic links encountered during recursive directory traversals.

Heisst, dass fr einen SymLink, den ich auf der Kommandozeile 
angebe, die Datei verndert wird, statt dem Link, die ja nie 
verndert werden.

Aber eben, beim rekursiven abarbeiten von Dateien und Verzeichnissen 
werden symbolische Links ignoriert.

phoenix:~# chmod --version
chmod (coreutils) 5.0.91
Gre
Chris
--
---
*  Christoph Lffler - c.loeffler AT xtraport DOT de  *
*  Linux-User #346921 - visit http://counter.li.org/  *
*  Fingerprint: GnuPG *
*  9082 0E53 50C1 209C 0E6F 4E3A 26F0 83F3 072B 44B0  *
---
--
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Klaus Becker
Hallo Leute,

mein Freund hat seine 80 GB Dateien unter /home/user kopiert und mit 
entsprechenden Rechten ausgestattet, kann aber keine einzige Datei lesen. 
Konqueror zeigt z. B. für jedes Bild einen kleinen Fotoapparat.

Da die Deteien alle von Win98 kommen, liegt das Problem vermutlich dort. Wer 
kann helfen?

Klaus



Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Rainer Bendig, Digitally Impressed
Hossa Klaus, *,
Klaus Becker schrieb am 07.07.2004 14:21:
Hallo Leute,
mein Freund hat seine 80 GB Dateien unter /home/user kopiert und mit 
entsprechenden Rechten ausgestattet, kann aber keine einzige Datei lesen. 
Konqueror zeigt z. B. für jedes Bild einen kleinen Fotoapparat.
$chown user:grupe * -Rv
Das setzt deinen Freund user als eigentümer der Dateien fest. Leider 
reicht ein einfaches kopieren und chmodden als root nicht aus (na ja, 
leider, das ist ganz gut so...)

--
so long,
Rainer Bendig aka mindz PGP/GPG key  (ID: 0x1D2BE499)
http://DigitallyImpressed.com   get it from wwwkeys.de.pgp.net
for contacting me take a look on http://digitallyimpressed.com/contact
--
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Gerd Terlutter
Klaus Becker wrote:
Hallo Leute,
mein Freund hat seine 80 GB Dateien unter /home/user kopiert und mit 
entsprechenden Rechten ausgestattet, kann aber keine einzige Datei lesen. 
Konqueror zeigt z. B. für jedes Bild einen kleinen Fotoapparat.

Da die Deteien alle von Win98 kommen, liegt das Problem vermutlich dort. Wer 
kann helfen?

Klaus
wieso fangen neue threads mitllerweile wieder mit Re: an? kann dein 
mailclient keine neuen threads erstellen?

--
# Gerd Terlutter | Müller+Blanck Software GmbH #
# office:+49 40 500 171-1| http://www.mplusb.de#


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Klaus Becker
On Wednesday 07 July 2004 14:26, Rainer Bendig, Digitally Impressed wrote:
 Hossa Klaus, *,

 Klaus Becker schrieb am 07.07.2004 14:21:
  Hallo Leute,
 
  mein Freund hat seine 80 GB Dateien unter /home/user kopiert und mit
  entsprechenden Rechten ausgestattet, kann aber keine einzige Datei lesen.
  Konqueror zeigt z. B. für jedes Bild einen kleinen Fotoapparat.

 $chown user:grupe * -Rv

 Das setzt deinen Freund user als eigentümer der Dateien fest. Leider
 reicht ein einfaches kopieren und chmodden als root nicht aus (na ja,
 leider, das ist ganz gut so...)

Hallo Rainer,

er hat chown -R user /home/user und dann chmod -R 777 /home/user 
eingegeben. (777 ist zuviel des Guten, aber es war nur provisorisch für einen 
schnellen Test).

$chown user:grupe * -Rv kenne ich nicht, du meinst sicher
$chown user:groupe * -Rv ? Ohne Angabe von /home/user?

Aber auch als root sind die Dateien nicht lesbar, daher befürchte ich, dass es 
nicht nur an den Zugriffsrechten liegt. Die Dateien sind aber da, konqueror 
gibt ihre Grösse an.

bye
Klaus




Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Michelle Konzack
Am 2004-07-07 14:26:45, schrieb Rainer Bendig, Digitally Impressed:

$chown user:grupe * -Rv

Besser währe: 

chown -R user. *
# Der Punkt setzt automatisch die Richtige GROUP für den Benutzer

find $HOME/das-80GB-Verzeichnis/ -type f -exec chmod 600 {} ';'
find $HOME/das-80GB-Verzeichnis/ -type d -exec chmod 700 {} ';'
 ^^^
# Kann natürlich auch etwas liberaler gewählt werden :-)

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Klaus Becker
On Wednesday 07 July 2004 17:17, Michelle Konzack wrote:
 Am 2004-07-07 14:26:45, schrieb Rainer Bendig, Digitally Impressed:
 $chown user:grupe * -Rv

 Besser währe:

 chown -R user. *
 # Der Punkt setzt automatisch die Richtige GROUP für den Benutzer

 find $HOME/das-80GB-Verzeichnis/ -type f -exec chmod 600 {} ';'
 find $HOME/das-80GB-Verzeichnis/ -type d -exec chmod 700 {} ';'

Worin besteht der unterschied zu chmod -R 600 /home/user?

Klaus



Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Christoph Lffler
Hi,
Klaus Becker wrote:
On Wednesday 07 July 2004 17:17, Michelle Konzack wrote:
Am 2004-07-07 14:26:45, schrieb Rainer Bendig, Digitally Impressed:
$chown user:grupe * -Rv
Besser währe:
chown -R user. *
# Der Punkt setzt automatisch die Richtige GROUP für den Benutzer
find $HOME/das-80GB-Verzeichnis/ -type f -exec chmod 600 {} ';'
find $HOME/das-80GB-Verzeichnis/ -type d -exec chmod 700 {} ';'

Worin besteht der unterschied zu chmod -R 600 /home/user?
dabei wird alles (auch Verzeichnisse) auf 600 gesetzt, Michelles 
Lösung sorgt dafür, dass Verzeichnisse das Recht gesetzt bekommen, 
dass der User hineinwechseln kann.

Auch möglich wäre ein chmod -R u+rwX,g-rwxst,o-rwxst /home/user
siehe `man chmod`, das grosse X setzt das nur bei Verzeichnissen.
Grüße
Chris
--
---
*  Christoph Löffler - c.loeffler AT xtraport DOT de  *
*  Linux-User #346921 - visit http://counter.li.org/  *
*  Fingerprint: GnuPG *
*  9082 0E53 50C1 209C 0E6F 4E3A 26F0 83F3 072B 44B0  *
---
--
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Michelle Konzack
Am 2004-07-07 17:32:26, schrieb Klaus Becker:
On Wednesday 07 July 2004 17:17, Michelle Konzack wrote:

 find $HOME/das-80GB-Verzeichnis/ -type f -exec chmod 600 {} ';'
 find $HOME/das-80GB-Verzeichnis/ -type d -exec chmod 700 {} ';'

Worin besteht der unterschied zu chmod -R 600 /home/user?

Das keine micht einemal Du mehr ins Verzeichnis Wecheln kannst, 
wenn Du es einaml verlassen hast. Es fehlt das eXecutable Flag

Dateien mit 600 sind wichlich NUR von DIR und ROOT lesbar, genauso 
wie Verzeichnis mit 700 NUR von DIR und ROOT betreten werden dürfen.

Klaus

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Alexander Schmehl
* Klaus Becker [EMAIL PROTECTED] [040707 17:32]:

 find $HOME/das-80GB-Verzeichnis/ -type f -exec chmod 600 {} ';'
 find $HOME/das-80GB-Verzeichnis/ -type d -exec chmod 700 {} ';'
 Worin besteht der unterschied zu chmod -R 600 /home/user?

Hast du dein Kommando mal probiert? Es geht schief, wenn es
Unterverzeichnise gibt, die Daten enthalten, weil du nicht mehr in die
Unterverzeichnisse wechelsn kannst. Und das dieses Szenario eintritt ist
doch relativ wahrscheinlich.


Yours sincerely,
  Alexander


signature.asc
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Jan Trippler
Am Mittwoch, 7. Juli 2004 15:39 schrieb Klaus Becker:
[Dateien nicht lesbar]
 er hat chown -R user /home/user und dann chmod -R 777
 /home/user eingegeben. (777 ist zuviel des Guten, aber es war
 nur provisorisch für einen schnellen Test).

 $chown user:grupe * -Rv kenne ich nicht, du meinst sicher
 $chown user:groupe * -Rv ? Ohne Angabe von /home/user?

 Aber auch als root sind die Dateien nicht lesbar, daher befürchte
 ich, dass es nicht nur an den Zugriffsrechten liegt. Die Dateien
 sind aber da, konqueror gibt ihre Grösse an.

Was heisst denn nicht lesbar? Welche Fehlermeldung kommt? Was sagt 
file datei?

Jan



Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Markus Meyer
Christoph Lffler wrote:
 
 Auch mglich wre ein chmod -R u+rwX,g-rwxst,o-rwxst /home/user
 
 siehe `man chmod`, das grosse X setzt das nur bei Verzeichnissen.

Aber bitte Obacht bei 'chmod -R'. Wenn man symbolische Links in dem
Verzeichnis hat, dann folgt 'chmod' diesem. Von daher ist eigentlich immer
die 'find . -exec chmod' Methode vorzuziehen. Aber das ist ja bei Daten,
die vom Fenster rueberkopiert wurden eher nicht der Fall ;)


Gruss,

Markus


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)




Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Klaus Becker
On Wednesday 07 July 2004 19:18, Jan Trippler wrote:
 Am Mittwoch, 7. Juli 2004 15:39 schrieb Klaus Becker:
 [Dateien nicht lesbar]

  er hat chown -R user /home/user und dann chmod -R 777
  /home/user eingegeben. (777 ist zuviel des Guten, aber es war
  nur provisorisch für einen schnellen Test).
 
  $chown user:grupe * -Rv kenne ich nicht, du meinst sicher
  $chown user:groupe * -Rv ? Ohne Angabe von /home/user?
 
  Aber auch als root sind die Dateien nicht lesbar, daher befürchte
  ich, dass es nicht nur an den Zugriffsrechten liegt. Die Dateien
  sind aber da, konqueror gibt ihre Grösse an.

 Was heisst denn nicht lesbar? Welche Fehlermeldung kommt? Was sagt
 file datei?

 Jan

Hallo Jan,

das Ganze spielt sich bei einem Kumpel ab, der von Tuten und Blasen (noch) 
keine Ahnung hat. Ich versuche, per Telefon seine Probleme zu lösen und ihn 
in Linux einzuführen. Im Moment hat er keine Internetverbindung.

Er versucht, mit Knoppix oder Mandrake10.0 *.jpg-Bilder zu öffnen oder z. B. 
*.doc-Dateien mit OO. Nichts geht. Den Befehl file kannte ich nicht, müssen 
wir erst noch ausprobieren.

Die Dateien wurden mit rsync von einer Festplatte auf eine andere kopiert. Die 
Festplatte hat aber ein Problem: Mandrake kann sie nicht lesen und startet 
nicht, wenn sie eingehängt ist, knoppix stört das nicht, aber unter knoppix 
lassen sich nur einige der Dateien öffnen. Hier liegt sicher das Problem.
Meiner Meinung nach ist es ein Hardware-Problem, das zuerst gelöst werden 
muss. Die Kopie der Dateien mit rsync von einer Festplatte, die ein Problem, 
ist sicher in die Hose gegangen.


bye
Klaus





-- 
       .~.        http://katalogdeutsch.net
       /V\        annuaire des ressources internet
     //    \\      pour l'allemand
    /(     )\
     ^`~'^    powered by Linux
 
 Veuillez ne pas me joindre de textes aux formats Word ou 
 PowerPoint, mais plutôt aux formats «html», «pdf», «rtf» ou «txt». Merci.
 Cf: http://www.fsf.org/philosophy/no-word-attachments.fr.html



Re: Ordnung in Datensalat bringen

2004-07-07 Diskussionsfäden Jan Trippler
Am Mittwoch, 7. Juli 2004 20:01 schrieb Klaus Becker:
[...]
 Er versucht, mit Knoppix oder Mandrake10.0 *.jpg-Bilder zu öffnen
 oder z. B. *.doc-Dateien mit OO. Nichts geht. Den Befehl file
 kannte ich nicht, müssen wir erst noch ausprobieren.

file versucht anhand der magic number von Dateien bzw. durch eine 
Kurzanalyse der Inhalte herauszufinden, um was für einen Dateityp 
es sich handelt.

Bei Bildern kann Dir identify aus dem ImageMagick-Paket noch besser 
helfen.

 Die Dateien wurden mit rsync von einer Festplatte auf eine andere
 kopiert. Die Festplatte hat aber ein Problem: Mandrake kann sie
 nicht lesen und startet nicht, wenn sie eingehängt ist, knoppix
 stört das nicht, aber unter knoppix lassen sich nur einige der
 Dateien öffnen. Hier liegt sicher das Problem. Meiner Meinung
 nach ist es ein Hardware-Problem, das zuerst gelöst werden muss.
 Die Kopie der Dateien mit rsync von einer Festplatte, die ein
 Problem, ist sicher in die Hose gegangen.

Dann kannst Du z. B. über die Dateigröße und evtl. über eine 
Prüfsumme (md5sum, cksum) mal prüfen, ob die Dateien auch noch die 
gleichen sind wie auf der Originalplatte.

Jan



Re: Ordnung in Datensalat bringen

2004-07-06 Diskussionsfäden Thomas Piekarski
On Sunday, the  4. July 2004 [UTC: 1088931207]
[EMAIL PROTECTED] (Joerg Rieger) writes...
 
 Also sowas mach ich auch:
 
 find . -exec md5sum {} 2/dev/null \; | sort | uniq -W 1 -D 
 double.txt
 
 Dauert bei 80 GB gaaanz schön lang.
 

Weshalb verwendest du bei einer solchen Datenmenge und bei einem
solchen Zweck MD5 Checksummen? Da bei diesem Zweck die Sicherheit der
Checksummen kaum eine Rolle spielt, waere es doch schneller wenn du
auf einfachere Checksummen zurueckgreifen wurdest, wie zum Beispiel 
SFV (simple file verify) oder CSV (comma seperated vaules). Solche
Checksummen sind mit cfv schneller generiert als MD5
Checksummen.


Gruss, Thomas.

___
Packete:

Package: cfv
Section: utils
Filename: pool/main/c/cfv/cfv_1.11-1_all.deb
Description: 
tests and creates .sfv, .csv and md5 files
cfv is a utility to both test and create .sfv (Simple File
Verify).csv, and md5sum files. These files are commonly used
to ensure the correct retrieval or storage of data.



pgpWYkG2N53kq.pgp
Description: PGP signature


Re: Ordnung in Datensalat bringen

2004-07-05 Diskussionsfäden Joerg Rieger
On Sun, Jul 04, 2004 at 08:34:38PM +0200, Dieter Franzke wrote:
 On Sunday 04 July 2004 20:23, Joerg Rieger wrote:
  On Sun, Jul 04, 2004 at 08:04:59PM +0200, Thomas Vollmer wrote:
   On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
  
   [...]
  
Also sowas mach ich auch:
   
find . -exec md5sum {} 2/dev/null \; | sort | uniq -W 1 -D 
double.txt
   
Dauert bei 80 GB gaaanz schön lang.
  
   außerdem hat der Ansatz ein weiteres Problem. Er findet Doubletten nur
   bei 100%iger  Gleichheit. Man denke mal an JPEGs bei denen mal der EXIF
   Header angefasst wurde, das Bild gedreht oder eine Farbkorrektur
   vorgenommen wurde. Oder diverse Officeformate wo bei einer Version nur
   mal auf Speichern gedrückt wurde. Dies sind inhaltlich gleiche Dateien
   deren Hash sich aber durchaus unterscheidet.
 
  Das ist richtig. Nur würde es ungleich aufwendiger, wenn man, wie in
  deinen Beispielen, noch solche Fälle berücksichtigen würde.
 
 für so etwas gibt es auch fertiges:
 filedupe, läuft bei mir unter BSD.
 Ob es ein .deb gibt entzieht sich im Moment meiner Kenntnis

Zumindest in unstable gibts eins Package: fdupes

Geht auch deutlich flotter zur Sache als meine Lösung bei gleichen 
Daten:

fdupes
real0m3.000s
user0m1.518s
sys 0m0.625s

find+md5sumco
real0m37.227s
user0m20.852s
sys 0m4.438s


-- 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Joerg Rieger
On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
 Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
 Hossa *,
 Michelle Konzack schrieb am 03.07.2004 22:30:
 
 Also Peer, ein Bekannter von mir in Offenburg hat als erstes die 
 hash-Werte aller Dateien ermittelt und dann sortiert...
 dazu gibt es nen nettes prog ... md5tree  nur hab ich im Augenblick 
 keine Ahnung woher das beziehen ist ...  Auch ne kurze googlei blieb 
 ohne nennenswerte ergebnisse ...
 
 Ja, ich hatte es aber mit md5sums gemacht.
 Also ich habe es mit find und ner schleife.
 Jedesmal wenn find eine Datei gefunden hat, hat er den die md5-Summe 
 berechnet, in eine Datei geschrieben, ein TABSTOP angehängt und dann 
 den Pfad/Datei. 

Also sowas mach ich auch:

find . -exec md5sum {} 2/dev/null \; | sort | uniq -W 1 -D  double.txt

Dauert bei 80 GB gaaanz schön lang.

-- 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Martin Schmitz
Michelle Konzack [EMAIL PROTECTED] writes:

 Am 2004-07-03 15:55:33, schrieb Klaus Becker:
Hallo Leute,

Vielleicht gibt es ein Skript um so etwas zu automatisieren oder vielleicht 
ist jemand bereit, ein Skript zu erstellen? Ich kann leider nicht 
programmieren, sonst wrde ich es selbst versuchen. Ich denke an den Einsatz 
von diff, find usw. 

 Also Peer, ein Bekannter von mir in Offenburg hat als erstes die 
 hash-Werte aller Dateien ermittelt und dann sortiert...

 Mit der Tabelle dann die doppelten gelscht... usw...

Das funktioniert aber nur in Offenburg!

scnr,
Martin


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Michelle Konzack
Am 2004-07-04 10:53:27, schrieb Joerg Rieger:

Also sowas mach ich auch:

find . -exec md5sum {} 2/dev/null \; | sort | uniq -W 1 -D  double.txt

Dauert bei 80 GB gaaanz schön lang.

:-)

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Klaus Becker
On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
 On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
  Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
  Hossa *,
  
  Michelle Konzack schrieb am 03.07.2004 22:30:
  Also Peer, ein Bekannter von mir in Offenburg hat als erstes die
  hash-Werte aller Dateien ermittelt und dann sortiert...
  
  dazu gibt es nen nettes prog ... md5tree  nur hab ich im Augenblick
  keine Ahnung woher das beziehen ist ...  Auch ne kurze googlei blieb
  ohne nennenswerte ergebnisse ...
 
  Ja, ich hatte es aber mit md5sums gemacht.
  Also ich habe es mit find und ner schleife.
  Jedesmal wenn find eine Datei gefunden hat, hat er den die md5-Summe
  berechnet, in eine Datei geschrieben, ein TABSTOP angehängt und dann
  den Pfad/Datei.

 Also sowas mach ich auch:

 find . -exec md5sum {} 2/dev/null \; | sort | uniq -W 1 -D  double.txt

 Dauert bei 80 GB gaaanz schön lang.

mit Sicherheit, aber da kann man nichts dran machen. Ich hab's mal 
ausprobiert: funktionniert, aber eine Frage: warum md5sum, und wenn md5sum 
schon notwendig ist, ist das Anzeigen der Ergebnisse von md5sum wirklich 
nützlich und kann man es nicht eventuell abstellen?

auf jeden Fall vielen Dank, das ist genau das, was mein Kumpel suchte. Er hat 
übrigens inzwischen seine Dateien mit knoppix und rsync auf die gewollte 
Festplatte kopiert. Sonderbar ist, dass sich auf der Zielpartition viel mehr 
Dateien befinden als auf der Quellpartition. Das gilt für manche Ordner, bei 
anderen Ordnern stimmt die Zahl der darin befindlichen Dateien überein.

Aber 1. schreibt rsync nicht auf die Quellpartition, 2. war sie nicht mit 
Schreibrechten gemountet. Es kann sich IMHO nur um ein Anzeige-Problem von 
knoppix und/oder konqueror handeln.

tschüs
Klaus



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Michelle Konzack
Hallo Klaus, 

Am 2004-07-04 15:06:18, schrieb Klaus Becker:

auf jeden Fall vielen Dank, das ist genau das, was mein Kumpel suchte. Er hat 
übrigens inzwischen seine Dateien mit knoppix und rsync auf die gewollte 
Festplatte kopiert. Sonderbar ist, dass sich auf der Zielpartition viel mehr 
Dateien befinden als auf der Quellpartition. Das gilt für manche Ordner, bei 
anderen Ordnern stimmt die Zahl der darin befindlichen Dateien überein.

Sieht nach einem UTF-8 problem aus :-)
Hatte Peer am Anfang auch. Wegen WinXP und dem Samba-Server

tschüs
Klaus

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Thomas Vollmer
On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
 On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
  Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
  Michelle Konzack schrieb am 03.07.2004 22:30:

Hi,

[...]

 Also sowas mach ich auch:

 find . -exec md5sum {} 2/dev/null \; | sort | uniq -W 1 -D 
 double.txt

 Dauert bei 80 GB gaaanz schön lang.

außerdem hat der Ansatz ein weiteres Problem. Er findet Doubletten nur 
bei 100%iger  Gleichheit. Man denke mal an JPEGs bei denen mal der EXIF 
Header angefasst wurde, das Bild gedreht oder eine Farbkorrektur 
vorgenommen wurde. Oder diverse Officeformate wo bei einer Version nur 
mal auf Speichern gedrückt wurde. Dies sind inhaltlich gleiche Dateien 
deren Hash sich aber durchaus unterscheidet.

Gruß
Thomas

-- 
IRC: TomseDive  Jabber: [EMAIL PROTECTED]   ICQ: 4843585


pgptdtZekDAYS.pgp
Description: PGP signature


Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Joerg Rieger
On Sun, Jul 04, 2004 at 03:06:18PM +0200, Klaus Becker wrote:
 On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
  find . -exec md5sum {} 2/dev/null \; | sort | uniq -W 1 -D  double.txt
 
  Dauert bei 80 GB gaaanz schön lang.
 
 mit Sicherheit, aber da kann man nichts dran machen. Ich hab's mal 
 ausprobiert: funktionniert, aber eine Frage: warum md5sum, und wenn md5sum 
 schon notwendig ist, ist das Anzeigen der Ergebnisse von md5sum wirklich 
 nützlich und kann man es nicht eventuell abstellen?

Nun, stell dir einfach mal die frage:
Wie stellt man am besten fest, ob eine oder mehrere Dateien gleich sind?

Jetzt könnte man natürlich spontan sagen: Ist doch klar, gleicher 
Dateiname auch gleiche Datei.

Das geht aber nicht mit jeder Datei gut. Z.B.: gibts mit Sicherheit bei 
vielen Source Code Dateien eine Datei names Makefile oder README's etc.

Ok, dann nächste Kriterium: Dateigrösse oder Dateidatum. Aber wenn man 
kurz darüber nachdenkt, geht das u.U. ebenfalls in die Hose. Eine 
gleichnamige Textdatei kann ja gleichgross sein, aber völlig 
unterschiedlichen Inhalt haben.

Daher der Umweg über einen Hashwert. Anhand des Hashwertes wird 
die Liste der Dateien sortiert und nur doppelte Hash Werte werden 
letzendlich ausgegeben. Man könnte die Ausgabe dann nochmal bearbeiten 
und den Hash wieder entfernen:

find . -exec md5sum {} 2/dev/null \; | sort | uniq -W 1 -D | awk '{print $2}' -  
double.txt


-- 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Joerg Rieger
On Sun, Jul 04, 2004 at 08:04:59PM +0200, Thomas Vollmer wrote:
 On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
  On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
   Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
   Michelle Konzack schrieb am 03.07.2004 22:30:
 
 [...]
 
  Also sowas mach ich auch:
 
  find . -exec md5sum {} 2/dev/null \; | sort | uniq -W 1 -D 
  double.txt
 
  Dauert bei 80 GB gaaanz schön lang.
 
 außerdem hat der Ansatz ein weiteres Problem. Er findet Doubletten nur 
 bei 100%iger  Gleichheit. Man denke mal an JPEGs bei denen mal der EXIF 
 Header angefasst wurde, das Bild gedreht oder eine Farbkorrektur 
 vorgenommen wurde. Oder diverse Officeformate wo bei einer Version nur 
 mal auf Speichern gedrückt wurde. Dies sind inhaltlich gleiche Dateien 
 deren Hash sich aber durchaus unterscheidet.

Das ist richtig. Nur würde es ungleich aufwendiger, wenn man, wie in 
deinen Beispielen, noch solche Fälle berücksichtigen würde.

-- 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Ordnung in Datensalat bringen

2004-07-04 Diskussionsfäden Dieter Franzke
Hi,

On Sunday 04 July 2004 20:23, Joerg Rieger wrote:
 On Sun, Jul 04, 2004 at 08:04:59PM +0200, Thomas Vollmer wrote:
  On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
   On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
Michelle Konzack schrieb am 03.07.2004 22:30:
 
  [...]
 
   Also sowas mach ich auch:
  
   find . -exec md5sum {} 2/dev/null \; | sort | uniq -W 1 -D 
   double.txt
  
   Dauert bei 80 GB gaaanz schön lang.
 
  außerdem hat der Ansatz ein weiteres Problem. Er findet Doubletten nur
  bei 100%iger  Gleichheit. Man denke mal an JPEGs bei denen mal der EXIF
  Header angefasst wurde, das Bild gedreht oder eine Farbkorrektur
  vorgenommen wurde. Oder diverse Officeformate wo bei einer Version nur
  mal auf Speichern gedrückt wurde. Dies sind inhaltlich gleiche Dateien
  deren Hash sich aber durchaus unterscheidet.

 Das ist richtig. Nur würde es ungleich aufwendiger, wenn man, wie in
 deinen Beispielen, noch solche Fälle berücksichtigen würde.

für so etwas gibt es auch fertiges:
filedupe, läuft bei mir unter BSD.
Ob es ein .deb gibt entzieht sich im Moment meiner Kenntnis


ciao


dieter 



Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Klaus Becker
Hallo Leute,

es geht immer noch um den Rechner eines Freundes, der 80 GB/GO von einer 
Festplatte auf eine andere kopieren muss.

Wenn die Daten einmal kopiert sind, kommt das 2. Problem: unter den 80 GB 
kommen viele Daten und Ordner mehrfach vor, kurz es herrscht Chaos. Manuell 
dauert es sicher Tage und Wochen, um da Ordnung rein zu bringen, und die 
Wahrscheinlichkeit menschlicher Fehler ist gross.

Vielleicht gibt es ein Skript um so etwas zu automatisieren oder vielleicht 
ist jemand bereit, ein Skript zu erstellen? Ich kann leider nicht 
programmieren, sonst würde ich es selbst versuchen. Ich denke an den Einsatz 
von diff, find usw. 

bye
Klaus



Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Klaus Becker
On Saturday 03 July 2004 15:55, Klaus Becker wrote:
 Hallo Leute,

 es geht immer noch um den Rechner eines Freundes, der 80 GB/GO von einer
 Festplatte auf eine andere kopieren muss.

 Wenn die Daten einmal kopiert sind, kommt das 2. Problem: unter den 80 GB
 kommen viele Daten und Ordner mehrfach vor, kurz es herrscht Chaos. Manuell
 dauert es sicher Tage und Wochen, um da Ordnung rein zu bringen, und die
 Wahrscheinlichkeit menschlicher Fehler ist gross.

 Vielleicht gibt es ein Skript um so etwas zu automatisieren oder vielleicht
 ist jemand bereit, ein Skript zu erstellen? Ich kann leider nicht
 programmieren, sonst würde ich es selbst versuchen. Ich denke an den
 Einsatz von diff, find usw.

Ich sollte vielleicht noch präzisieren: das Ziel ist, von allen Dateien nur 
eine Version zu behalten, und zwar die (zeitlich) letzte.

bye
Klaus



Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Dieter Franzke
Hi,

On Saturday 03 July 2004 16:40, Klaus Becker wrote:
 On Saturday 03 July 2004 15:55, Klaus Becker wrote:
  Hallo Leute,
 
  es geht immer noch um den Rechner eines Freundes, der 80 GB/GO von einer
  Festplatte auf eine andere kopieren muss.
 
  Wenn die Daten einmal kopiert sind, kommt das 2. Problem: unter den 80 GB
  kommen viele Daten und Ordner mehrfach vor, kurz es herrscht Chaos.
  Manuell dauert es sicher Tage und Wochen, um da Ordnung rein zu bringen,
  und die Wahrscheinlichkeit menschlicher Fehler ist gross.
 
  Vielleicht gibt es ein Skript um so etwas zu automatisieren oder
  vielleicht ist jemand bereit, ein Skript zu erstellen? Ich kann leider
  nicht programmieren, sonst würde ich es selbst versuchen. Ich denke an
  den Einsatz von diff, find usw.

 Ich sollte vielleicht noch präzisieren: das Ziel ist, von allen Dateien nur
 eine Version zu behalten, und zwar die (zeitlich) letzte.

man rsync
man find
man tar

hat das mit rsync denn nicht funktioniert?
Wie hast du rsync aufgerufen?

dieter



Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Klaus Becker
On Saturday 03 July 2004 17:36, Dieter Franzke wrote:
 Hi,

 On Saturday 03 July 2004 16:40, Klaus Becker wrote:
  On Saturday 03 July 2004 15:55, Klaus Becker wrote:
   Hallo Leute,
  
   es geht immer noch um den Rechner eines Freundes, der 80 GB/GO von
   einer Festplatte auf eine andere kopieren muss.
  
   Wenn die Daten einmal kopiert sind, kommt das 2. Problem: unter den 80
   GB kommen viele Daten und Ordner mehrfach vor, kurz es herrscht Chaos.
   Manuell dauert es sicher Tage und Wochen, um da Ordnung rein zu
   bringen, und die Wahrscheinlichkeit menschlicher Fehler ist gross.
  
   Vielleicht gibt es ein Skript um so etwas zu automatisieren oder
   vielleicht ist jemand bereit, ein Skript zu erstellen? Ich kann leider
   nicht programmieren, sonst würde ich es selbst versuchen. Ich denke an
   den Einsatz von diff, find usw.
 
  Ich sollte vielleicht noch präzisieren: das Ziel ist, von allen Dateien
  nur eine Version zu behalten, und zwar die (zeitlich) letzte.

Ich erfahre gerade, die Dateien haben alle das gleiche Datum.


 man rsync
 man find
 man tar

Ok, aber ich kann nicht mein Leben damit verbringen, es gibt vielleicht Leute, 
die so ein Skript schon haben oder es relativ schnell schreiben können. Ich 
würde Stunden dafür brauchen, ohne sicher zu sein, dass ich mein Ziel 
erreiche. Listen sind doch auch dafür da, um um konkrete Hilfe zu bitten.


 hat das mit rsync denn nicht funktioniert?
 Wie hast du rsync aufgerufen?

rsync -auv --ignore-errors Quelle Ziel

Die Sache läuft zur Zeit, mein Freund ruft mich an, wenn alles fertig ist.

Klaus



Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Michelle Konzack
Am 2004-07-03 15:55:33, schrieb Klaus Becker:
Hallo Leute,

Vielleicht gibt es ein Skript um so etwas zu automatisieren oder vielleicht 
ist jemand bereit, ein Skript zu erstellen? Ich kann leider nicht 
programmieren, sonst würde ich es selbst versuchen. Ich denke an den Einsatz 
von diff, find usw. 

Also Peer, ein Bekannter von mir in Offenburg hat als erstes die 
hash-Werte aller Dateien ermittelt und dann sortiert...

Mit der Tabelle dann die doppelten gelöscht... usw...

bye
Klaus

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Rainer Bendig, Digitally Impressed
Hossa *,
Michelle Konzack schrieb am 03.07.2004 22:30:
Also Peer, ein Bekannter von mir in Offenburg hat als erstes die 
hash-Werte aller Dateien ermittelt und dann sortiert...
dazu gibt es nen nettes prog ... md5tree  nur hab ich im Augenblick 
keine Ahnung woher das beziehen ist ...  Auch ne kurze googlei blieb 
ohne nennenswerte ergebnisse ...

--
so long,
Rainer Bendig aka mindz PGP/GPG key  (ID: 0x1D2BE499)
http://DigitallyImpressed.com   get it from wwwkeys.de.pgp.net
for contacting me take a look on http://digitallyimpressed.com/contact
--
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)


Re: Ordnung in Datensalat bringen

2004-07-03 Diskussionsfäden Michelle Konzack
Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
Hossa *,
Michelle Konzack schrieb am 03.07.2004 22:30:

Also Peer, ein Bekannter von mir in Offenburg hat als erstes die 
hash-Werte aller Dateien ermittelt und dann sortiert...
dazu gibt es nen nettes prog ... md5tree  nur hab ich im Augenblick 
keine Ahnung woher das beziehen ist ...  Auch ne kurze googlei blieb 
ohne nennenswerte ergebnisse ...

Ja, ich hatte es aber mit md5sums gemacht.
Also ich habe es mit find und ner schleife.
Jedesmal wenn find eine Datei gefunden hat, hat er den die md5-Summe 
berechnet, in eine Datei geschrieben, ein TABSTOP angehängt und dann 
den Pfad/Datei. 

Naja, unter Linux gibt es immer mehr wege.

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature