MERILLON JEAN-JACQUES wrote:
Bonjour

Je voulais savoir si il existe un moyen de donner la corrélation entre 2
mots qui ont une orthographe proche :
par exemple : Bidule et Bidulle, éléphant et éléfant, homme et omme doivent avoir une
forte corrélation.


Le but de ce script serai de chercher dans une base de données 2 lignes
identiques mais orthographiées différemment.

Est ce que je suis assez clair ??


Non, pas tout à fait. C'est quoi comme script? Shell? PHP? Si c'est avec PHP (je pense qu'il y aurait d'autres listes plus appropriées), je te conseille de jeter un coup d'oeil à la founction "soundex" qui est utilisée par les généalogistes pour comparer des patronymes dont l'orthographe a pas mal changé en passant d'un pays à l'autre. Ainsi, Müller, Mueller et Miller seraient considérés comme équivalents. L'inconvénient serait que l'algorithme est très permissif, ainsi même le nom de Mahler serait considéré comme équivalent. En effet, seule la première lettre et les trois consonnes uniques suivantes sont prises en considération.


ricky

P.S.: Démo soundex ici: http://www.geocities.com/Heartland/Hills/3916/soundex.html
Algorithme: http://www.myatt.demon.co.uk/sxalg.htm



Vous souhaitez acquerir votre Pack ou des Services MandrakeSoft?
Rendez-vous sur "http://www.mandrakestore.com";

Répondre à