Le 20/05/2016 à 16:55, Bernard Escaich a écrit :
Il y a des logiciels qui transforment les pdf en document word par exemple.
Mais quand on voit la structure des pdf, je suis sceptique sur la possibilité 
de reconstituer le document d'origine ; exemple : on a un document texte sur 2 
colonnes ; quand on sélectionne le texte, il sélectionne la ligne 1 col 1, puis 
ligne 1 col 2, ligne 2 col1...
Le copier-coller à partir d'un pdf se passe en général très mal !

Je serais curieux d'entendre le point de vue d'un connaisseur de LO.
Je ne comprends pas comment fonctionnent les générateurs de pdf, ni pourquoi 
ils adoptent une logique aussi peu logique.
Pour ma part, sur Mac, je n'utilise plus le générateur intégré de pdf mais 
celui de Mac OS dont le rendu est meilleur.
il ne faut pas oublier que le pdf est une visualisation du postcript qui est un format d'impression. La génération du pdf est donc en gros linéaire et ne tient pas compte des paragraphes. Ce ne sont que des éléments avec des coordonnées. De plus, le pdf n'est pas fait pour être édité ! je ne parle pas du pdf hybride qui comme sont nom l'indique est un hybride.

Il est souvent préférable de passer par un ocr pour récupérer les textes. Le résultat est normalement bon puisque les caractères sont parfait contrairement à un scan

Cordialement,

Bernard Escaich
Gérard

--
Envoyez un mail à [email protected] pour savoir comment vous 
désinscrire
Les archives de la liste sont disponibles à 
http://listarchives.libreoffice.org/fr/users/
Tous les messages envoyés sur cette liste seront archivés publiquement et ne 
pourront pas être supprimés

Répondre à