Re: [fr-users] [Draw] Import PDF, texte introuvable
Peut-être un peu moins lourd et tout aussi pratique : https://fr.pdf24.org/ Je l'utilise en remplacement de PDF Creator depuis des années. J'avais également constaté que la solution de Microsoft sort des fichiers plus volumineux. Cordialement, David Le 13/01/2020 à 22:13, Stéphane Santon a écrit : Bonjour, Le 13/01/2020 à 21:12, Patrick Auclair a écrit : Pour info voici ce que l'on trouve à la fin du fichier (ouvert avec notepad ++) :
Re: [fr-users] [Draw] Import PDF, texte introuvable
Bonjour, Le 14/01/2020 à 07:34, Patrick Auclair a écrit : Perso je n'installe pas PDFCreator car totalement inutile. Moi ça me rend service tous les jours. Sur Win j'utilise ce qui existe : Imprimer -> imprimante : Microsoft print to PDF. Sur "Win" ?? Pas ça sur mes Windows (7 et 8.1). Je n'ai que "Microsoft XPS Document Writer. Et c'est totalement incapable de me sortir un PNG ou un SVG comme sait le faire PDFCreator. D'ailleurs, et cela m'a fait sourire, à partir du PDF téléchargé sur le site de la mairie : on l'ouvre avec Acrobat Reader puis on l'imprime avec cette imprimante (crosoft). Et, on peut alors ouvrir le nouveau fichier avec draw sans peine, LOL ;). Je n'avais pas pensé à cette méthode. Je fais parfois ça avec PDFCreator pour faire sauter des protections de PDF. -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [fr-users] [Draw] Import PDF, texte introuvable
Le 14/01/2020 à 07:34, Patrick Auclair a écrit : Bonjour, Perso je n'installe pas PDFCreator car totalement inutile. Sur Win j'utilise ce qui existe : Imprimer -> imprimante : Microsoft print to PDF. D'ailleurs, et cela m'a fait sourire, à partir du PDF téléchargé sur le site de la mairie : on l'ouvre avec Acrobat Reader puis on l'imprime avec cette imprimante (crosoft). Et, on peut alors ouvrir le nouveau fichier avec draw sans peine, LOL ;). Je n'avais pas pensé à cette méthode. Cordialement Patrick Bonjour, J'ai constaté que les PDF créés avec Microsoft print to PDF sont beaucoup plus lourds que ceux créés avec PDFCreator (qui permet en plus beaucoup d'autres choses). Cordialement, Henri -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [fr-users] [Draw] Import PDF, texte introuvable
Le 14/01/2020 à 07:34, Patrick Auclair a écrit : Bonjour, Perso je n'installe pas PDFCreator car totalement inutile. Sur Win j'utilise ce qui existe : Imprimer -> imprimante : Microsoft print to PDF. D'ailleurs, et cela m'a fait sourire, à partir du PDF téléchargé sur le site de la mairie : on l'ouvre avec Acrobat Reader puis on l'imprime avec cette imprimante (crosoft). Et, on peut alors ouvrir le nouveau fichier avec draw sans peine, LOL ;). Je n'avais pas pensé à cette méthode. Cordialement Patrick Bonjour, J'ai constaté que les PDF créés avec Microsoft print to PDF sont beaucoup plus lourds que ceux créés avec PDFCreator (qui permet en plus beaucoup d'autres choses). Cordialement, Henri -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [fr-users] [Draw] Import PDF, texte introuvable
Bonjour Stéphane en l'occurence quel est le logiciel de mise en page utilisé ? J'ai du mal à croire que l'export PDF en lui-même soit responsable.Par contre si la conception se fait avec une police exotique, le remplacement est plus hasardeux, surtout si, comme l'explique Bob, le type de Police est voué à l'échec dès le départ... Y-a-t-il une volontée quelconque des auteurs de protéger le texte ? ClaireLe lundi 13 janvier 2020 à 10:29 +0100, Stéphane Santon a écrit : > Merci pour ces infos. > Donc une police "de type 3" :- est-elle sur l'ordi car imprimante > Postscript, donc sur le soft de mise en page, et il vaut mieux ne pas > la choisir ?- est-ce une gamme de polices utilisées par un soft en > particulier ?- est-ce un format d'export PDF seulement ? > Merci > > Le 13/01/2020 à 10:06, Bob a écrit : > > Bonjour,Ce document utilise des polices de type 3, encodées de > > manière non-standard. On ne peut en extraire aucun texte, ni dans > > Draw ni même dans le lecteur PDF. Il se peut que les auteurs de ce > > document aient volontairement employé des polices spéciales ou des > > sous-ensembles incomplets de polices afin d'empêcher le copier- > > coller de texte ou la réédition du pdf.Le problème est à la source, > > et Libreoffice n'y peut rien du tout.RC > > > - Mail original - > > > > De: "Stéphane Santon" À: "Liste > > > > libOo" Envoyé: Lundi 13 Janvier 2020 > > > > 09:21:55Objet: [fr-users] [Draw] Import PDF, texte introuvable > > > > Bonjour, > > > > Pourquoi est-ce que dans certains documents PDF "externes" > > > > quej'ouvreavec Draw, je ne peux pas retrouver les textes > > > > corrects, ceux-ci sontbien dans des zones de texte mais > > > > remplacés par différents caractèressans sens de phrase > > > > ?(pourtant ce ne sont pas des PDF issus de scans) > > > > D'ailleurs dans ces mêmes documents, les recherches de texte > > > > dans unlecteur PDF sont toujours sans résultat. > > > > En lien un exemple de pdf : > > > > https://www.cjoint.com/c/JAniunAGujB > > > > > > > > Merci > > > > > > > > plus sérieusement, ce document doit être sorti de la têted'un > > > > macounet pervers utilisant des produits daubés ... > > > > désolé, mais j'ai essayé en ligne de commande et je n'ai > > > > rienobtenu d'exploitable, il ne reste plus qu'à passer par de > > > > l'ocr -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [fr-users] [Draw] Import PDF, texte introuvable
Bonjour, Perso je n'installe pas PDFCreator car totalement inutile. Sur Win j'utilise ce qui existe : Imprimer -> imprimante : Microsoft print to PDF. D'ailleurs, et cela m'a fait sourire, à partir du PDF téléchargé sur le site de la mairie : on l'ouvre avec Acrobat Reader puis on l'imprime avec cette imprimante (crosoft). Et, on peut alors ouvrir le nouveau fichier avec draw sans peine, LOL ;). Je n'avais pas pensé à cette méthode. Cordialement Patrick Le 13/01/2020 à 22:13, Stéphane Santon a écrit : Bonjour, Le 13/01/2020 à 21:12, Patrick Auclair a écrit : Pour info voici ce que l'on trouve à la fin du fichier (ouvert avec notepad ++) :
Re: [fr-users] [Draw] Import PDF, texte introuvable
Bonjour, Le 13/01/2020 à 21:12, Patrick Auclair a écrit : Pour info voici ce que l'on trouve à la fin du fichier (ouvert avec notepad ++) :
Re: [fr-users] [Draw] Import PDF, texte introuvable
Bonjour, Le 13/01/2020 à 16:58, Ocleyr2lalune a écrit : Y-a-t-il une volonté quelconque des auteurs de protéger le texte ? Je pense que non. Plutôt un manque d'info sur les moyens utilisés. -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [fr-users] [Draw] Import PDF, texte introuvable
Bonsoir, Il existe une solution pour modifier ce fichier et obtenir quelque chose d'à peu près "potable" qu'il est possible de retravailler avec Draw. Pour cela il faut avoir installé au préalable le logiciel Inkscape. J'ai utilisé la version : Inkscape Portable 0.92.4 fr pour windows, pas testé sur ma distri Linux (Debian 10) mais cela devrait fonctionner aussi avec une version Linux de Inkscape. Petit lien pour récupérer cette version : http://www.netfox2.net/modules/wfdownloads/singlefile.php?cid=252=1462 Processus appliqué : 1 - J'ai téléchargé le PDF original sur le site de la mairie de Bussac sur Charente. 2 - Ouvert Inkscape, puis "fichier - ouvrir" et on sélectionne le document précédemment téléchargé. 3 - Une fenêtre "Préférences pour l'importation d'un fichier PDF" s'ouvre. Par défaut 2 cases à cocher sont activées : Remplacer les polices du Pdf .. Incorporer les images ... * Les décocher. * Puis sélectionner le bouton radio " Import Poppler / Cairo" à la place de "Importation interne". * Mettre la "précision" en bas à 2. 4 - Valider et attendre un petit moment. Et, c'est magique on obtient le document avec le texte. (Attention il n'y a pas de zone de texte, c'est du caractère par caractère. 5 - Ensuite il faut "enregistrer sous" .PDF et dans la fenêtre qui s'ouvre sélectionner Pdf 1.4 à la place de 1.5. (J'ai pas testé cette dernière version - à voir). On peut aussi choisir d'enregistrer en . SVG. Ne surtout pas prendre le format .ODG, ça ne fonctionne pas. 6 - Ouvrir avec draw (pour moi cela a parfaitement fonctionné). Pour info voici ce que l'on trouve à la fin du fichier (ouvert avec notepad ++) : 2 0 obj >endobj Bon courage, cordialement, Patrick Le 13/01/2020 à 09:21, Stéphane Santon a écrit : Bonjour, Pourquoi est-ce que dans certains documents PDF "externes" que j'ouvre avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont bien dans des zones de texte mais remplacés par différents caractères sans sens de phrase ? (pourtant ce ne sont pas des PDF issus de scans) D'ailleurs dans ces mêmes documents, les recherches de texte dans un lecteur PDF sont toujours sans résultat. En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB Merci -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [fr-users] [Draw] Import PDF, texte introuvable
Bonjour, Oui, l'export par pdfcreator est peut-être responsable du souci, pas sûr. La police de type 3 est dans l'ordi et incorporée dans le fichier pdf ; quand on imprime cette police est envoyée à l'imprimante (ça peut être long). Essaye de faire composer le texte dans une police assez standard (genre Arial, Helvetica) pour voir si ça sort mieux. RC Merci pour ces infos. Donc une police "de type 3" : - est-elle sur l'ordi car imprimante Postscript, donc sur le soft de mise en page, et il vaut mieux ne pas la choisir ? - est-ce une gamme de polices utilisées par un soft en particulier ? - est-ce un format d'export PDF seulement ? -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [fr-users] [Draw] Import PDF, texte introuvable
Le 13/01/2020 à 10:36, Bernard Schoenacker a écrit : - Mail original - De: "Stéphane Santon" À: "Liste libOo" Envoyé: Lundi 13 Janvier 2020 09:21:55 Objet: [fr-users] [Draw] Import PDF, texte introuvable Bonjour, Pourquoi est-ce que dans certains documents PDF "externes" que j'ouvre avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont bien dans des zones de texte mais remplacés par différents caractères sans sens de phrase ? (pourtant ce ne sont pas des PDF issus de scans) D'ailleurs dans ces mêmes documents, les recherches de texte dans un lecteur PDF sont toujours sans résultat. En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB Merci hello la période est échue pour toi (noel et les santons) plus sérieusement, ce document doit être sorti de la tête d'un macounet pervers utilisant des produits daubés ... PDFCreator Version 0.9.5, c'est plutôt windows... d'aillerus pas très à jour pour un fichier de 2018 ! C'est une police type 3 incluse dans le pdf désolé, mais j'ai essayé en ligne de commande et je n'ai rien obtenu d'exploitable, il ne reste plus qu'à passer par de l'ocr de fait rien d'exploitable bonne journée @+ bernard Gérard -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [fr-users] [Draw] Import PDF, texte introuvable
Merci pour ces infos. Donc une police "de type 3" : - est-elle sur l'ordi car imprimante Postscript, donc sur le soft de mise en page, et il vaut mieux ne pas la choisir ? - est-ce une gamme de polices utilisées par un soft en particulier ? - est-ce un format d'export PDF seulement ? Merci Le 13/01/2020 à 10:06, Bob a écrit : Bonjour, Ce document utilise des polices de type 3, encodées de manière non-standard. On ne peut en extraire aucun texte, ni dans Draw ni même dans le lecteur PDF. Il se peut que les auteurs de ce document aient volontairement employé des polices spéciales ou des sous-ensembles incomplets de polices afin d'empêcher le copier-coller de texte ou la réédition du pdf. Le problème est à la source, et Libreoffice n'y peut rien du tout. RC - Mail original - De: "Stéphane Santon" À: "Liste libOo" Envoyé: Lundi 13 Janvier 2020 09:21:55 Objet: [fr-users] [Draw] Import PDF, texte introuvable Bonjour, Pourquoi est-ce que dans certains documents PDF "externes" que j'ouvre avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont bien dans des zones de texte mais remplacés par différents caractères sans sens de phrase ? (pourtant ce ne sont pas des PDF issus de scans) D'ailleurs dans ces mêmes documents, les recherches de texte dans un lecteur PDF sont toujours sans résultat. En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB Merci plus sérieusement, ce document doit être sorti de la tête d'un macounet pervers utilisant des produits daubés ... désolé, mais j'ai essayé en ligne de commande et je n'ai rien obtenu d'exploitable, il ne reste plus qu'à passer par de l'ocr -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [fr-users] [Draw] Import PDF, texte introuvable
Le 13/01/2020 à 09:36, Bernard Schoenacker a écrit : - Mail original - De: "Stéphane Santon" À: "Liste libOo" Envoyé: Lundi 13 Janvier 2020 09:21:55 Objet: [fr-users] [Draw] Import PDF, texte introuvable Bonjour, Pourquoi est-ce que dans certains documents PDF "externes" que j'ouvre avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont bien dans des zones de texte mais remplacés par différents caractères sans sens de phrase ? (pourtant ce ne sont pas des PDF issus de scans) D'ailleurs dans ces mêmes documents, les recherches de texte dans un lecteur PDF sont toujours sans résultat. En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB Merci hello la période est échue pour toi (noel et les santons) :-) plus sérieusement, ce document doit être sorti de la tête d'un macounet pervers utilisant des produits daubés ... désolé, mais j'ai essayé en ligne de commande et je n'ai rien obtenu d'exploitable, il ne reste plus qu'à passer par de l'ocr Merci. Je ne cherche pas à récupérer le texte, mais simplement à comprendre pourquoi (et peut-être pour conseiller l'adjoint à ma commune). Est-ce un problème de format, de polices manquantes, de codage spécifique à des logiciels propriétaires (daube ou haut de gamme je ne sais pas...), ... ? Merci -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [fr-users] [Draw] Import PDF, texte introuvable
Bonjour, Ce document utilise des polices de type 3, encodées de manière non-standard. On ne peut en extraire aucun texte, ni dans Draw ni même dans le lecteur PDF. Il se peut que les auteurs de ce document aient volontairement employé des polices spéciales ou des sous-ensembles incomplets de polices afin d'empêcher le copier-coller de texte ou la réédition du pdf. Le problème est à la source, et Libreoffice n'y peut rien du tout. RC - Mail original - De: "Stéphane Santon" À: "Liste libOo" Envoyé: Lundi 13 Janvier 2020 09:21:55 Objet: [fr-users] [Draw] Import PDF, texte introuvable Bonjour, Pourquoi est-ce que dans certains documents PDF "externes" que j'ouvre avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont bien dans des zones de texte mais remplacés par différents caractères sans sens de phrase ? (pourtant ce ne sont pas des PDF issus de scans) D'ailleurs dans ces mêmes documents, les recherches de texte dans un lecteur PDF sont toujours sans résultat. En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB Merci plus sérieusement, ce document doit être sorti de la tête d'un macounet pervers utilisant des produits daubés ... désolé, mais j'ai essayé en ligne de commande et je n'ai rien obtenu d'exploitable, il ne reste plus qu'à passer par de l'ocr -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [fr-users] [Draw] Import PDF, texte introuvable
- Mail original - > De: "Stéphane Santon" > À: "Liste libOo" > Envoyé: Lundi 13 Janvier 2020 09:21:55 > Objet: [fr-users] [Draw] Import PDF, texte introuvable > > Bonjour, > > Pourquoi est-ce que dans certains documents PDF "externes" que > j'ouvre > avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont > bien dans des zones de texte mais remplacés par différents caractères > sans sens de phrase ? > (pourtant ce ne sont pas des PDF issus de scans) > > D'ailleurs dans ces mêmes documents, les recherches de texte dans un > lecteur PDF sont toujours sans résultat. > > En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB > > Merci > hello la période est échue pour toi (noel et les santons) plus sérieusement, ce document doit être sorti de la tête d'un macounet pervers utilisant des produits daubés ... désolé, mais j'ai essayé en ligne de commande et je n'ai rien obtenu d'exploitable, il ne reste plus qu'à passer par de l'ocr bonne journée @+ bernard -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
[fr-users] [Draw] Import PDF, texte introuvable
Bonjour, Pourquoi est-ce que dans certains documents PDF "externes" que j'ouvre avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont bien dans des zones de texte mais remplacés par différents caractères sans sens de phrase ? (pourtant ce ne sont pas des PDF issus de scans) D'ailleurs dans ces mêmes documents, les recherches de texte dans un lecteur PDF sont toujours sans résultat. En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB Merci -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy