Se le fatture sono italiane, probabilmente hai anche i files xml. Con
quelli potrebbe essere più facile estrarre dati.

Carlo

Il ven 14 gen 2022, 13:23 Fabio Mura <[email protected]> ha scritto:

> Ciao, se usi linux potresti provare ad utilizzare pdfgrep che è in grado di
> estrarre del testo da un pdf e poi lo reindirizzi ad esempio in un file
> txt. Io l'ho usato per rinominare dei file pdf in maniera ricorsiva
> prendendo del testo dall'interno che era posizionato sempre nella stessa
> riga.
> La cosa funziona ma ci vuole un pò di lavoro
> esempio (con una fattura pdf) dico a pdfgrep di intercettare nel pdf la
> riga con la parola "imposta" e tirare fuori il testo della
> riga  reindirizzandolo in un file txt
>
> *pdfgrep -in imposta *.pdf > test.txt*
> quello che poi trovo nel file txt è questo (estratto dal modello fattura
> allegato)
>
> *1:
>      Imposta IVA                   220,00*
>
> ok ho il testo, a questo punto devo decidere quanto sbattermi per estrarre
> i dati che mi interessano e organizzarmi per poi avere una tabella, se ne
> vale la pena in termini di tempo risparmiato
>
>
>
>
>
>
> Il giorno ven 14 gen 2022 alle ore 11:31 Valerio Messina <[email protected]> ha
> scritto:
>
> > On 1/14/22 9:45 AM, Edoardo Ingrassia wrote:
> > > Ho un numero molto elevato di
> > > fatture in formato PDF (tutte di uguale formato). Vorrei prendere solo
> > > alcuni dati di queste fatture, cioè numero fattura, la data,
> > > l'imponibile e l'IVA pagata. Questi dati devono essere riportati tutti
> > > su un foglio di calc. Faccio un esempio, il foglio dovrebbe avere 4
> > > colonne dove c'è nella prima numero fattura, nella seconda la data,
> > > poi l'imponibile e poi l'IVA. Fino ad adesso ho inserito tutto a mano
> > > e volevo sapere se esiste una soluzione "automatizzata" dato che è
> > > tutto in formato elettronico
> >
> > LibreOffice non è lo strumento giusto per fare quella cosa.
> >
> > Io userei la libreria poppler e le poppler-utils, trovi comandi che
> > convertono i PDF in testo o HTML in modo automatizzato, poi con uno
> > script di bash, estrai i campi di interesse e produci facilmente un file
> > CSV che poi importi in OpenOffice.
> >
> > Richiede un minimo di smanettamento.
> >
> > Se usi Windows visto che la libreria non è pre-installata, esiste un
> > port già pre-compilato, lo trovi linkato su Wikipedia:
> > https://en.wikipedia.org/wiki/Poppler_%28software%29
> >
> > --
> > Valerio
> >
> > --
> > Come cancellarsi: E-mail [email protected]
> > Problemi?
> > https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/
> > Linee guida per postare + altro:
> > https://wiki.documentfoundation.org/Local_Mailing_Lists/it
> > Archivio della lista: https://listarchives.libreoffice.org/it/users/
> > Privacy Policy: https://www.documentfoundation.org/privacy
> >
>
>
> --
> Fabio Mura
>
> --
> Come cancellarsi: E-mail [email protected]
> Problemi?
> https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/
> Linee guida per postare + altro:
> https://wiki.documentfoundation.org/Local_Mailing_Lists/it
> Archivio della lista: https://listarchives.libreoffice.org/it/users/
> Privacy Policy: https://www.documentfoundation.org/privacy
>

-- 
Come cancellarsi: E-mail [email protected]
Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/
Linee guida per postare + altro: 
https://wiki.documentfoundation.org/Local_Mailing_Lists/it
Archivio della lista: https://listarchives.libreoffice.org/it/users/
Privacy Policy: https://www.documentfoundation.org/privacy

Rispondere a