Re: geroglifici in pdftotext

2018-02-13 Per discussione Gollum1
Il February 13, 2018 7:42:42 AM UTC, Marco Bodrato ha scritto: >Ciao, > >Il Lun, 12 Febbraio 2018 8:06 pm, Davide Prina ha scritto: >> On 12/02/2018 14:59, Piviul wrote: > >> Questo caso sarebbe, in teoria, semplice da risolvere: basterebbe >avere >> un programma che

Re: geroglifici in pdftotext

2018-02-12 Per discussione Marco Bodrato
Ciao, Il Lun, 12 Febbraio 2018 8:06 pm, Davide Prina ha scritto: > On 12/02/2018 14:59, Piviul wrote: >> credo non ci sia nulla da fare[¹], sembra sia stata appositamente >> manomessa la toUnicode map... > Questo caso sarebbe, in teoria, semplice da risolvere: basterebbe avere > un programma

Re: geroglifici in pdftotext

2018-02-12 Per discussione Davide Prina
On 12/02/2018 14:59, Piviul wrote: credo non ci sia nulla da fare[¹], sembra sia stata appositamente manomessa la toUnicode map... [¹] https://acrobatusers.com/forum/security/usage-fonts-non-unicode-glyph-mapping-pdf-documents-copy-protection/ Questo caso sarebbe, in teoria, semplice da

Re: geroglifici in pdftotext

2018-02-12 Per discussione Paolo Redælli
Il 12/02/2018 14:59, Piviul ha scritto: Libreoffice Draw la apre e si vedono un sacco di bellissimi geroglifici... :( credo non ci sia nulla da fare[¹], sembra sia stata appositamente manomessa la toUnicode map... In pratica ti obbligano a convertire il documento in una serie di immagini ed

Re: geroglifici in pdftotext

2018-02-12 Per discussione Piviul
Il 12/02/2018 12:05, Piviul ha scritto: Il 12/02/2018 10:31, Paolo Redælli ha scritto: [...] Io la butto lì: hai provato ad aprire il PDF con un LibreOffice recente? Dovrebbe poter editare il tutto facendolo diventare un documento "Libreoffice Draw" Ora si ;) Libreoffice Draw la apre e si

Re: geroglifici in pdftotext

2018-02-12 Per discussione Piviul
Il 12/02/2018 10:31, Paolo Redælli ha scritto: [...] Io la butto lì: hai provato ad aprire il PDF con un LibreOffice recente? Dovrebbe poter editare il tutto facendolo diventare un documento "Libreoffice Draw" Ora si ;) Libreoffice Draw la apre e si vedono un sacco di bellissimi

Re: geroglifici in pdftotext

2018-02-12 Per discussione Paolo Redælli
Il 12/02/2018 08:57, Piviul ha scritto: Il 09/02/2018 20:43, Davide Prina ha scritto: On 09/02/2018 14:45, Piviul wrote: pdf a cui dovrei estrapolare il testo contenuto. Con evince lo apro e lo vedo correttamente ma se vado a selezionare il testo, copiarlo e ad incollarlo in un file di

Re: geroglifici in pdftotext

2018-02-12 Per discussione Piviul
Il 09/02/2018 20:43, Davide Prina ha scritto: On 09/02/2018 14:45, Piviul wrote: pdf a cui dovrei estrapolare il testo contenuto. Con evince lo apro e lo vedo correttamente ma se vado a selezionare il testo, copiarlo e ad incollarlo in un file di testo si vedono solo geroglifici. potrebbe

Re: geroglifici in pdftotext

2018-02-11 Per discussione Piviul
Il 09/02/2018 21:21, Giuliano Curti ha scritto: [...] Non so se può essere d'aiuto, mi sembra cmq che il PDF sia un contenitore multiformato: se il formato è TEXT estrarre il contenuto dovrebbe essere facile (a me capita di farlo con una semplice selezione e copia); se il formato è GRAFICO

Re: geroglifici in pdftotext

2018-02-09 Per discussione Giuliano Curti
Il 9 feb 2018 8:43 PM, "Davide Prina" ha scritto: On 09/02/2018 14:45, Piviul wrote: > pdf a cui dovrei estrapolare il testo contenuto. Non so se può essere d'aiuto, mi sembra cmq che il PDF sia un contenitore multiformato: se il formato è TEXT estrarre il

Re: geroglifici in pdftotext

2018-02-09 Per discussione Davide Prina
On 09/02/2018 14:45, Piviul wrote: pdf a cui dovrei estrapolare il testo contenuto. Con evince lo apro e lo vedo correttamente ma se vado a selezionare il testo, copiarlo e ad incollarlo in un file di testo si vedono solo geroglifici. potrebbe essere che sono stati usati caratteri unicode

Re: geroglifici in pdftotext

2018-02-09 Per discussione Piviul
Il 09/02/2018 14:45, Piviul ha scritto: Ciao a tutti, ho qualche pdf a cui dovrei estrapolare il testo contenuto. Con evince lo apro e lo vedo correttamente ma se vado a selezionare il testo, copiarlo e ad incollarlo in un file di testo si vedono solo geroglifici. Se lo do in pasto a pdftotext

geroglifici in pdftotext

2018-02-09 Per discussione Piviul
Ciao a tutti, ho qualche pdf a cui dovrei estrapolare il testo contenuto. Con evince lo apro e lo vedo correttamente ma se vado a selezionare il testo, copiarlo e ad incollarlo in un file di testo si vedono solo geroglifici. Se lo do in pasto a pdftotext fa uguale. file --mime-type dice