On Thursday, November 03, 2011 12:22:12 PM Tyndare wrote: > Je suis partis sur une approche plus simpliste qui doit être similaire > à ta première tentative. Je me contente des données récupérée par > qadastre: un Path composé d'une liste de commandes (moveto, lineto, > curveto) et une liste de coordonnées associées. > J'ai pris comme à priori que les numéros de rue seraient toujours > écris avec la même police et devrais donc être composés exactement des > même commandes dans le même ordre.Ensuite pour comparer la liste des > coordonnées associées aux commandes, j'applique une transformation > (déplacement et rotation) pour ramener la première de la liste à (0,0) > et la troisième à l'horizontale (en choisissant la deuxième ça ne > marchait pas pour le chiffre 3) et je met le tout à échelle pour que > ça rentre dans un carré d'1 de large. > Ca a l'air très fiable si les coordonnées sont assez précises, et je > pense que c'est généralisable au texte (chaque mot génère un Path mais > il faut ensuite les assembler).
J'avais codé une solution statistique de reconnaissance du texte sur un principe similaire (avec assemblage des mots, rotation puis traitement des «delta», mais je m'étais heurté aux soucis indiqués par Frédéric, et j'avais alors arreêté. > Pour les problèmes de tailles, je commence à me dire qu'il n'y a pas > d'autre solution que de repartir sur un découpage des requêtes au > cadastre en plusieurs pdf comme le fait le script import-bati.sh Oui, il faudra faire ça. Par contre, ça implique *beaucoup* de travail.
signature.asc
Description: This is a digitally signed message part.
_______________________________________________ dev-fr mailing list [email protected] http://lists.openstreetmap.org/listinfo/dev-fr
