Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-09-15 Per discussione Gollum1
RIprendo questo post, mi trovo finalmente nella necessità di dover accedere a tutti quei dati, quindi sono spronato a realizzare qualcosa di utile. fatto un punto della situazione, e letto i vostri interventi mi sono convinto di realizzare la seguente struttura: 1) Deamon di scansione: -) semp

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-21 Per discussione Marco Beri
2013/6/21 Gollum1 > Bhe... in prospettiva avere anche una suddivisione per tipo di file > (ripeto, magic number e non estensione) faciliterebbe e non di poco il > lavoro che uno fa al browser, solitamente quando uno comincia a lavorare > sui duplicati, cerca la tipologia di file a cui è più inter

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-21 Per discussione Gollum1
Il giorno 20/giu/2013 20:43, "Marco Beri" ha scritto: > > Il giorno 20/giu/2013 20:03, "Gollum1" ha scritto: > > Il tipo di file potrebbe essere l'output del comando file (in ambiente *nix, non si se esiste un corrispettivo winzoz... se ci fosse un modulo python che restituisce i "magic number"

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-21 Per discussione Carlos Catucci
2013/6/20 Marco Beri > Sono passati 22 anni per me. > > H:> DEL *.dbf > > > H: era un disco di rete Novell senza possibilità di fare undelete e DEL > doveva essere DIR. > OUCH! Io ricordo un qualcuno aveva fatto per errore un chmod 777 * con utente root in / su un server Unix. Fortuna che ne ave

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Marco Beri
2013/6/20 Marco Mariani > Sono passati quasi 20 anni, ma mi ricordo ancora... > > # mkswap /dev/hda 3 > Sono passati 22 anni per me. H:> DEL *.dbf H: era un disco di rete Novell senza possibilità di fare undelete e DEL doveva essere DIR. Ciao. Marco. -- http://beri.it/ - Un blog http://ber

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Marco Mariani
Sono passati quasi 20 anni, ma mi ricordo ancora... # mkswap /dev/hda 3 ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Simone Federici
dopo 36 ore di lavoro di fila per recuperare un server di posta elettronica. Il mio capo scrisse due punti di troppo chown www:www -R ../../../ siamo chiaramente OT. per tornare in tema, e monitorare i file dell'hd https://github.com/seb-m/pyinotify/wiki per windows se non sbaglio c'è un porti

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Marco Beri
Il giorno 20/giu/2013 22:37, "Manlio Perillo" ha scritto: > > -BEGIN PGP SIGNED MESSAGE- > Hash: SHA1 > > Il 20/06/2013 22:35, Marco Beri ha scritto: > > Il giorno 20/giu/2013 22:29, "Gollum1" > > ha scritto: > >> > >> Assassino... > > > > Sfido chiunque

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Marco Beri
Il giorno 20/giu/2013 22:29, "Gollum1" ha scritto: > > Assassino... Sfido chiunque a dimostrare che il mio comando non cancella tutti i file doppi (con qualche leggerissimo effetto collaterale). :-) Ciao. Marco. ___ Python mailing list Python@lists.py

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Gollum1
Assassino... -- Gollum1 teoro, dov'è il mio teoro... Il giorno 20/giu/2013 21:56, "Marco Beri" ha scritto: > Il giorno 20/giu/2013 21:38, "Simone Federici" ha > scritto: > > > > ls -i1 * | awk ‘dup[$1]++{print $1 ” ” $2}’ > > > > find . -type f -exec md5sum ‘{}’ \; | sort | awk ‘dup[$1

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Nadir Sampaoli
Il giorno 20 giugno 2013 21:55, Marco Beri ha scritto: > Per cancellare tutti i file doppi questa è ancora più veloce: > > sudo rm -r / > Per sicurezza aggiungici anche un bel -f! (per chi non fosse pratico, prego evitare di eseguire il comando!) -- Nadir _

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Marco Beri
Il giorno 20/giu/2013 21:38, "Simone Federici" ha scritto: > > ls -i1 * | awk ‘dup[$1]++{print $1 ” ” $2}’ > > find . -type f -exec md5sum ‘{}’ \; | sort | awk ‘dup[$1]++{print $2}’ Bella! Per cancellare tutti i file doppi questa è ancora più veloce: sudo rm -r / Ciao. Marco. _

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Simone Federici
ls -i1 * | awk ‘dup[$1]++{print $1 ” ” $2}’ find . -type f -exec md5sum ‘{}’ \; | sort | awk ‘dup[$1]++{print $2}’___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Marco Beri
Il giorno 20/giu/2013 20:03, "Gollum1" ha scritto: > > Il giorno 20/giu/2013 19:49, "Marco Beri" ha scritto: > > > Uhm... io guarderei solo la dimensione. Altrimenti può esserci un readme.rst e un leggimi.txt che sono uguali ma che ti sfuggono. > > > > Forse come tipo potresti mettere i primi 32

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Gollum1
Il giorno 20/giu/2013 20:07, "Diego Barrera" ha scritto: > > Il 20/06/2013 19:36, Gollum1 ha scritto: >> Il dubbio che mi viene... SQLite, permette gli accessi concorrenziali? >> > Sto seguendo con interesse il 3d.. > Nicola ti ha gia' risposto: e' la prima risposta del 3d. > Facci sapere alla fin

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Gollum1
Il giorno 20/giu/2013 19:49, "Marco Beri" ha scritto: > Uhm... io guarderei solo la dimensione. Altrimenti può esserci un readme.rst e un leggimi.txt che sono uguali ma che ti sfuggono. > > Forse come tipo potresti mettere i primi 32 byte del file, a quel punto avresti già una serie di MD5 che no

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Gollum1
Il giorno 20/giu/2013 17:06, "simozack" ha scritto: > > Il 20 giugno 2013 09:00, Gollum1 ha scritto: > > E qui corrisponde pressappoco a quello che voglio fare io, solo > > generalizzato a tutti i file e non solo a mp3. > > Ok, niente di che, è solo lungo da fare. > Lungo se si deve prevedere ch

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Marco Beri
2013/6/20 Gollum1 > Ecco... questo è un concetto da estendere... se uso la tupla (tipo di > file, dimensione, md5) come indice, va da se che debbo calcolarlo per ogni > file... se invece del dizionario si usa il DB (ormai assodato) il calcolo > md5 potrebbe essere demandato a quando trovo un altr

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Gollum1
Ecco... questo è un concetto da estendere... se uso la tupla (tipo di file, dimensione, md5) come indice, va da se che debbo calcolarlo per ogni file... se invece del dizionario si usa il DB (ormai assodato) il calcolo md5 potrebbe essere demandato a quando trovo un altro file dello stesso tipo e d

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Gollum1
Il giorno 20/giu/2013 19:28, "Marcello" ha scritto: > > Scusate se mi intrometto, tempo fa avevo fatto qualche cosa del genere, e per controllare il file al posto di MD5 (troppo oneroso di risorse) avevo utilizzato crc32, velocizzando il tutto di circa 20 volte. Vero, ma il crc32 ha molte più pos

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Marco Beri
2013/6/20 Marcello > Scusate se mi intrometto, tempo fa avevo fatto qualche cosa del genere, e > per controllare il file al posto di MD5 (troppo oneroso di risorse) avevo > utilizzato crc32, velocizzando il tutto di circa 20 volte. > Forse se l'MD5 viene calcolato solamente per i file di uguale

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Marcello
Scusate se mi intrometto, tempo fa avevo fatto qualche cosa del genere, e per controllare il file al posto di MD5 (troppo oneroso di risorse) avevo utilizzato crc32, velocizzando il tutto di circa 20 volte. Saluti Marcello ___ Python mailing list Python@l

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Marco Mariani
Ma senza bloom filter non è divertente :) ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python

Re: [Python] Proof of concept per un programma di scansione duplicati.

2013-06-20 Per discussione Gollum1
Il giorno 20/giu/2013 08:35, "simozack" ha scritto: > Avevo già fatto una cosa simile tempo fa per gli MP3. > > Io l'avevo pensata in questo modo: passare tutti i file presenti in > una data subdirectory, calcolare l'MD5 e registrare percorso, nome del > file e MD5 su un db sqlite (qui puoi sbizza

[Python] Proof of concept per un programma di scansione duplicati.

2013-06-19 Per discussione Gollum1
Ciao lista, In casa mi sono fatto un Severino con Debian, come tutti sappiamo, quando si hanno a disposizione questo spazi si comincia a buttare dentro roba senza pensarci più di tanto. Ora mi ritrovo con una marea di file duplicati, a volte anche con nomi diversi... ho privato diversi programmi