Il 25 luglio 2012 10:49, Federico Bruni <[email protected]> ha scritto:
> Il 25 luglio 2012 08:56, Paolo Sala <[email protected]> ha scritto:
>> Federico Bruni scrisse in data 25/07/2012 08:50:
>>> Il 25 luglio 2012 08:39, Piviul <[email protected]> ha scritto:
>>>
>>>> tieni però conto che se non cancelli fisicamente il testo che vuoi non
>>>> si veda senza essere degli hacker con acrobat reader nel menù file hai
>>>> una voce "Salva come testo" che ti esporta tutto il testo del pdf,
>>>> probabbilmente anche quello nascosto dal rettangolo bianco
>>>>
>>> ho appena fatto una prova (ho Adobe Reader 9.5.1 su windows emulato...
>>> adobereader per linux non ha quella voce)
>>> e il file di testo salvato contiene solo dei puntini ...... ......
>>>
>> Direi che allora il pdf di cui parli non contiene testo ma immagini...
>> "Salva come testo" equivale a pdftotext: esporta solo il testo se presente.
>>
>
> No, sono sicuro che il pdf contiene solo testo.
> Probabilmente non funziona con qualsiasi pdf.
>

La faccenda è più complicata..
Ero convinto che il pdf generato da pdf-shuffler fosse testo, perché
posso selezionare il testo.
Ma oggi mi sono accorto che la ricerca testuale in quel pdf non funziona.
Se copio una stringa e la incollo in un editor vedo tanti ????? al
posto dei caratteri.

Il salva testo di Adobe Reader funziona sul pdf originale ma non su
quello creato da pdf-shuffler, che evidentemente lo trasforma in
qualche strana forma di testo.


--
Per REVOCARE l'iscrizione alla lista, inviare un email a
[email protected] con oggetto "unsubscribe". Per
problemi inviare un email in INGLESE a [email protected]

To UNSUBSCRIBE, email to [email protected]
with a subject of "unsubscribe". Trouble? Contact [email protected]
Archive: 
http://lists.debian.org/CAPjDBpqZ07VLfErDJoURZCeWuqAt7E=kionuh6j9u8szxs6...@mail.gmail.com

Rispondere a