Il giorno 31 maggio 2012 22:49, Diego Barrera <diegonebarr...@yahoo.it> ha
scritto:

> Io ho risolto in questo modo:
> -prendo ciascun campo e mi ricavo lo slug;
> -trovo la sottostringa massima comune degli slug che sto confrontando, per
> ciascun campo;
> -a questo punto se il valore percentuale della sottostringa rispetto allo
> slug supera per ciascun campo una soglia minima stabilita, i due
> destinatari sono lo stesso destinatario
>

invece che la sottostringa di lunghezza massima potresti prendere la
distanza di Levenshtein fra le due stringhe:

http://en.wikipedia.org/wiki/Levenshtein_distance

puoi valutare se nel tuo caso sia più significativa.

Puoi implementarti l'algoritmo o usare uno di quelli già disponibili
Googlando ho trovato i seguenti (che non ho verificato):

http://en.wikibooks.org/wiki/Algorithm_implementation/Strings/Levenshtein_distance#Python

http://code.activestate.com/recipes/576874-levenshtein-distance/

Marco
_______________________________________________
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python

Rispondere a