Re: [it-users] importare pdf

2018-09-10 Per discussione Giovanni
Attilio, ma hai già provato con i siti che fanno le conversioni?

Io ricordo che l'ultima volta, per elaborare su calc una tabella contenuta
in un pdf (listino fornitori), risolsi così.

Prova a cercare "pdf to xls" o "pdf to csv".

-- 
Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org
Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/
Linee guida per postare + altro: 
https://wiki.documentfoundation.org/Local_Mailing_Lists/it
Archivio della lista: https://listarchives.libreoffice.org/it/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [it-users] importare pdf

2018-09-10 Per discussione Andrea Celli
Anche opensuse mi ha installato Pdftotext come componente dei poppler tools.

*> rpm -qf /usr/bin/pdftotext  poppler-tools-0.43.0-8.1.x86_64*
Quindi devi proprio installare poppler

L'esempio che dai è l'output di pdftotext?
Se fosse così, basterebbe importarlo in calc come se fosse un file.csv,
specificando che il separatore è "/"

Andrea

Il giorno 10 settembre 2018 16:47, atemp...@alice.it  ha
scritto:

> Il 10/09/2018 11:13, Ferrari Renato Maria ha scritto:
>
>>
>> Per elaborare file pdf; però piccoli e, soprattutto, a me serve solo il
>> testo,
>> io uso masterpdf.
>> Lo scarichi, per linux, dal sito del produttore.
>>
> Parto dall'ultimo messaggio giuntomi. Il cui consiglio lo metterei per il
> momento fra parentesi, giacché le tabelle che ho riportato su pdf vanno
> dalle 400 schede, alle 7.000 schede -o record che dir si voglia-: e si
> tratta quindi di file pdf, forse non abbastanza piccoli. Mentre poi
> scrivevo queste righe, mi è giunto anche il messaggio di Steevie: e gli
> chiedo scusa se lo prenderò in considerazione, dopo aver visto dove arrivo
> con i consigli dei messaggi precedenti.
>
> Do subito un esempio, delle schede di una delle tabelle: "Mann, Thomas /
> Confessioni del cavaliere d'industria Felix Krull  / 2015 / 3998". In tale
> esempio, ovviamente "/" indica il passaggio da una colonna a quella
> seguente; mentre l'ultima, colonna, riporta il numero progressivo che
> fungeva da chiave primaria. Di schede del genere, la relativa tabella ne
> contiene quasi 5.000; che in Okular occupano una settantina di pagine.
>
> In Okular, d'altra parte, ho costatato che le colonne non vengono
> completate nella seconda metà, del file; né so, come si può forzare un
> orientamento orizzontale. Ho comunque riprovato a selezionare le colonne,
> una per volta: e cliccando, sul pulsante "seleziona", una colonna di prova
> l'ho selezionata schermata per schermata. Dopo di che, su Calc una copia è
> riuscita; sia pur in modo grossolano, perché devo ancora chiarire come far
> sì che in Calc il testo resti entro la colonna.
>
> Infine, quanto a Pdftotext, in Ubuntu 18.04 non lo trovo installato e
> Synaptic mi dice, in merito, di installare Poppler: cosicché ho provveduto
> per tutti i relativi pacchetti. Mi trovo però, come ulteriore applicazione
> offerta per aprire i file pdf, Zathura; con la quale le colonne risultano
> troncate in misura, ancor maggiore.
>
>
>
>
>
> --
> Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org
> Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cance
> llarsi/
> Linee guida per postare + altro: https://wiki.documentfoundatio
> n.org/Local_Mailing_Lists/it
> Archivio della lista: https://listarchives.libreoffice.org/it/users/
> Privacy Policy: https://www.documentfoundation.org/privacy
>

-- 
Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org
Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/
Linee guida per postare + altro: 
https://wiki.documentfoundation.org/Local_Mailing_Lists/it
Archivio della lista: https://listarchives.libreoffice.org/it/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [it-users] importare pdf

2018-09-10 Per discussione atemp...@alice.it

Il 10/09/2018 11:13, Ferrari Renato Maria ha scritto:


Per elaborare file pdf; però piccoli e, soprattutto, a me serve solo 
il testo,

io uso masterpdf.
Lo scarichi, per linux, dal sito del produttore.
Parto dall'ultimo messaggio giuntomi. Il cui consiglio lo metterei per 
il momento fra parentesi, giacché le tabelle che ho riportato su pdf 
vanno dalle 400 schede, alle 7.000 schede -o record che dir si voglia-: 
e si tratta quindi di file pdf, forse non abbastanza piccoli. Mentre poi 
scrivevo queste righe, mi è giunto anche il messaggio di Steevie: e gli 
chiedo scusa se lo prenderò in considerazione, dopo aver visto dove 
arrivo con i consigli dei messaggi precedenti.


Do subito un esempio, delle schede di una delle tabelle: "Mann, Thomas / 
Confessioni del cavaliere d'industria Felix Krull  / 2015 / 3998". In 
tale esempio, ovviamente "/" indica il passaggio da una colonna a quella 
seguente; mentre l'ultima, colonna, riporta il numero progressivo che 
fungeva da chiave primaria. Di schede del genere, la relativa tabella ne 
contiene quasi 5.000; che in Okular occupano una settantina di pagine.


In Okular, d'altra parte, ho costatato che le colonne non vengono 
completate nella seconda metà, del file; né so, come si può forzare un 
orientamento orizzontale. Ho comunque riprovato a selezionare le 
colonne, una per volta: e cliccando, sul pulsante "seleziona", una 
colonna di prova l'ho selezionata schermata per schermata. Dopo di che, 
su Calc una copia è riuscita; sia pur in modo grossolano, perché devo 
ancora chiarire come far sì che in Calc il testo resti entro la colonna.


Infine, quanto a Pdftotext, in Ubuntu 18.04 non lo trovo installato e 
Synaptic mi dice, in merito, di installare Poppler: cosicché ho 
provveduto per tutti i relativi pacchetti. Mi trovo però, come ulteriore 
applicazione offerta per aprire i file pdf, Zathura; con la quale le 
colonne risultano troncate in misura, ancor maggiore.





--
Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org
Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/
Linee guida per postare + altro: 
https://wiki.documentfoundation.org/Local_Mailing_Lists/it
Archivio della lista: https://listarchives.libreoffice.org/it/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [it-users] importare pdf

2018-09-10 Per discussione Steevie
2018-09-08 16:06 GMT+02:00 atemp...@alice.it :
> Né c'è modo dunque per, da Draw, esportarli in Calc e Base... All'origine
> del mio problema, c'è l'evidentemente errata convinzione che in informatica
> sia possibile la retromarcia. Giacché avevo, di alcune tabelle in MySQL,
> fatto copie di sicurezza esportandole -attraverso PhpMyAdmin- in file PDF;
> che meglio di quelli in Calc si aprono, sul mio smartphone. Adesso, avrei
> bisogno, di riportare queste copie su MySQL (dove tali tabelle sono venute
> meno): ma la retromarcia risulta, appunto, impossibile e non vedo altra via,
> che quella di "copia e incolla".
Non è il "fare retromarcia" che è sbagliato, quanto il fare copie di
sicurezza di un'applicazione nel formato _non nativo_
dell'applicazione stessa: va sempre usato il formato proprio
dell'applicazione...

Se poi per comodità vuoi tenere copie in altro formato, per
consultarlo su dispositivi vari va benissimo, ma pretendere di
ricostruire un DB MySQL partendo da un PDF per importarlo in
/Calc/Draw/Base è concettualmente sbagliato. Sarebbe stato molto più
sensato esportare in CSV piuttosto che in PDF, formato importabile sia
in calc che in base (e forse anche direttamente in mysql) e con quasi
la stessa leggibilità di un PDF in questo caso.

Detto questo, è molto difficile fornire una soluzione senza sapere di
quale tipo di dati parliamo e del formato dei dati nel DB. Io di
solito per estrarre (parte di un) testo da un PDF, lo apro con un
lettore PDF come qpdfview e seleziono una porzione del testo, che si
può poi incollare in un altro documento. Quanto sia attuabile questo
procedimento, però, dipende molto dal tipo di dato contenuto nella
colonna, perché il testo incollato perde gli a capo e quindi viene
scritto in una sola riga, ma per ripopolare il DB dovrebbe essere
sufficiente. Per fare una prova, ho preso un estratt oconto della
banca: se seleziono la colonna "dare" o "avere", si ottiene
velocemente qualcosa di elaborabile/importabile in un foglio di
calcolo o db (una serie di numeri decimali separati da uno spazio),
se seleziono la colonna "descrizione operazione"... BUM! meglio
copiare ogni riga singolarmente.

Dato che qpdfview si basa sulle librerie poppler, mi aspetto che la
cosa sia possibile in altri lettori. In alternativa, e tenendo conto
delle considerazioni fatte sopra per il ofrmato dei dati la soluzione
pdftotext e successiva manipolazione via akw (più che con sed) ritengo
sia l'unica altra alternativa.

m2c,
Stefano
-- 
Stefano David, PhD

-- 
Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org
Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/
Linee guida per postare + altro: 
https://wiki.documentfoundation.org/Local_Mailing_Lists/it
Archivio della lista: https://listarchives.libreoffice.org/it/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [it-users] importare pdf

2018-09-10 Per discussione Ferrari Renato Maria

Il 09/09/18 14:04, atemp...@alice.it ha scritto:

Il 08/09/2018 23:12, Valerio Messina ha scritto:

On 08/09/2018 23:09, atemp...@alice.it wrote:
Vedo però, su Synaptic, che Okular fa parte di KDE; mentre io mi 
trovo in Gnome. Nessun problema?


collaborano tutti su freedesktop, per cui non ci sono problemi.
Io non uso ne Gnome ne KDE e Okular va benissimo per la selezione di 
tabelle.


Allora, resto per il momento sulla strada che mi hai consigliato tu; 
prima di considerare eventualmente i gentili consigli, che mi sono 
stati dati in seguito...


Ho installato Okular (nel dubbio, selezionando tutti i pacchetti 
trovati su Synaptic: non mi ricordo mai, se basta selezionare il primo 
pacchetto della lista e poi Synaptic vede da sè, quali altri pacchetti 
aggiungere...). Mi imbatto però, in due questioni e la prima è che, 
con Okular come con qpdfview, il file me lo trovo sullo schermo 
-qualunque sia lo zoom- non con tutte le sue, cinque colonne; ma con 
la quarta colonna che compare a metà soltanto, con la quinta che non 
compare proprio. Aprendo invece il file pdf, con Draw, ogni cosa è al 
suo posto (e da questo punto di vista l'ideale sarebbe procedere, da 
Draw a Calc; ma mi sembra che, in Draw, non si possano selezionare le 
colonne).


L'altra questione è: in Okular c'è un modo istantaneo per selezionare 
un'intera colonna, oppure occorre "Inseguire" il suo contenuto per, 
magari, cento schermate?


Grazie in anticipo...






Per elaborare file pdf; però piccoli e, soprattutto, a me serve solo il 
testo,

io uso masterpdf.
Lo scarichi, per linux, dal sito del produttore.

--
Ferrari Renato Maria
Linux Registered User #219791
Linux Registered Machine #104061
email: renatoferr...@tiscali.it
posta certificata: renatomaria.ferrari.d...@pec.mi.omceo.it


--
Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org
Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/
Linee guida per postare + altro: 
https://wiki.documentfoundation.org/Local_Mailing_Lists/it
Archivio della lista: https://listarchives.libreoffice.org/it/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [it-users] importare pdf

2018-09-10 Per discussione Valerio Messina

On 09/09/18 14:04, atemp...@alice.it wrote:
Okular come con qpdfview, il file me lo trovo sullo schermo -qualunque 
sia lo zoom- non con tutte le sue, cinque colonne; ma con la quarta 
colonna che compare a metà soltanto, con la quinta che non compare 
proprio.


Se anche con lo zoom minimo (menù visualizza) non vedi tutti, è un baco 
del programma



Aprendo invece il file pdf, con Draw, ogni cosa è al suo posto 
(e da questo punto di vista l'ideale sarebbe procedere, da Draw a Calc; 
ma mi sembra che, in Draw, non si possano selezionare le colonne).


L'altra questione è: in Okular c'è un modo istantaneo per selezionare 
un'intera colonna, oppure occorre "Inseguire" il suo contenuto per, 
magari, cento schermate?


se ricordo bene tenendo premuto CTRL si seleziona per colonne.

Ma quante pagine hai da importare?
Se sono tante allora è meglio usare poppler come ti consiglia Andrea, e 
poi usare un editor che abbia la selezione per colonne.


--
Valerio

--
Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org
Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/
Linee guida per postare + altro: 
https://wiki.documentfoundation.org/Local_Mailing_Lists/it
Archivio della lista: https://listarchives.libreoffice.org/it/users/
Privacy Policy: https://www.documentfoundation.org/privacy