Re: [it-users] importare pdf
Attilio, ma hai già provato con i siti che fanno le conversioni? Io ricordo che l'ultima volta, per elaborare su calc una tabella contenuta in un pdf (listino fornitori), risolsi così. Prova a cercare "pdf to xls" o "pdf to csv". -- Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/ Linee guida per postare + altro: https://wiki.documentfoundation.org/Local_Mailing_Lists/it Archivio della lista: https://listarchives.libreoffice.org/it/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [it-users] importare pdf
Anche opensuse mi ha installato Pdftotext come componente dei poppler tools. *> rpm -qf /usr/bin/pdftotext poppler-tools-0.43.0-8.1.x86_64* Quindi devi proprio installare poppler L'esempio che dai è l'output di pdftotext? Se fosse così, basterebbe importarlo in calc come se fosse un file.csv, specificando che il separatore è "/" Andrea Il giorno 10 settembre 2018 16:47, atemp...@alice.it ha scritto: > Il 10/09/2018 11:13, Ferrari Renato Maria ha scritto: > >> >> Per elaborare file pdf; però piccoli e, soprattutto, a me serve solo il >> testo, >> io uso masterpdf. >> Lo scarichi, per linux, dal sito del produttore. >> > Parto dall'ultimo messaggio giuntomi. Il cui consiglio lo metterei per il > momento fra parentesi, giacché le tabelle che ho riportato su pdf vanno > dalle 400 schede, alle 7.000 schede -o record che dir si voglia-: e si > tratta quindi di file pdf, forse non abbastanza piccoli. Mentre poi > scrivevo queste righe, mi è giunto anche il messaggio di Steevie: e gli > chiedo scusa se lo prenderò in considerazione, dopo aver visto dove arrivo > con i consigli dei messaggi precedenti. > > Do subito un esempio, delle schede di una delle tabelle: "Mann, Thomas / > Confessioni del cavaliere d'industria Felix Krull / 2015 / 3998". In tale > esempio, ovviamente "/" indica il passaggio da una colonna a quella > seguente; mentre l'ultima, colonna, riporta il numero progressivo che > fungeva da chiave primaria. Di schede del genere, la relativa tabella ne > contiene quasi 5.000; che in Okular occupano una settantina di pagine. > > In Okular, d'altra parte, ho costatato che le colonne non vengono > completate nella seconda metà, del file; né so, come si può forzare un > orientamento orizzontale. Ho comunque riprovato a selezionare le colonne, > una per volta: e cliccando, sul pulsante "seleziona", una colonna di prova > l'ho selezionata schermata per schermata. Dopo di che, su Calc una copia è > riuscita; sia pur in modo grossolano, perché devo ancora chiarire come far > sì che in Calc il testo resti entro la colonna. > > Infine, quanto a Pdftotext, in Ubuntu 18.04 non lo trovo installato e > Synaptic mi dice, in merito, di installare Poppler: cosicché ho provveduto > per tutti i relativi pacchetti. Mi trovo però, come ulteriore applicazione > offerta per aprire i file pdf, Zathura; con la quale le colonne risultano > troncate in misura, ancor maggiore. > > > > > > -- > Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org > Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cance > llarsi/ > Linee guida per postare + altro: https://wiki.documentfoundatio > n.org/Local_Mailing_Lists/it > Archivio della lista: https://listarchives.libreoffice.org/it/users/ > Privacy Policy: https://www.documentfoundation.org/privacy > -- Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/ Linee guida per postare + altro: https://wiki.documentfoundation.org/Local_Mailing_Lists/it Archivio della lista: https://listarchives.libreoffice.org/it/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [it-users] importare pdf
Il 10/09/2018 11:13, Ferrari Renato Maria ha scritto: Per elaborare file pdf; però piccoli e, soprattutto, a me serve solo il testo, io uso masterpdf. Lo scarichi, per linux, dal sito del produttore. Parto dall'ultimo messaggio giuntomi. Il cui consiglio lo metterei per il momento fra parentesi, giacché le tabelle che ho riportato su pdf vanno dalle 400 schede, alle 7.000 schede -o record che dir si voglia-: e si tratta quindi di file pdf, forse non abbastanza piccoli. Mentre poi scrivevo queste righe, mi è giunto anche il messaggio di Steevie: e gli chiedo scusa se lo prenderò in considerazione, dopo aver visto dove arrivo con i consigli dei messaggi precedenti. Do subito un esempio, delle schede di una delle tabelle: "Mann, Thomas / Confessioni del cavaliere d'industria Felix Krull / 2015 / 3998". In tale esempio, ovviamente "/" indica il passaggio da una colonna a quella seguente; mentre l'ultima, colonna, riporta il numero progressivo che fungeva da chiave primaria. Di schede del genere, la relativa tabella ne contiene quasi 5.000; che in Okular occupano una settantina di pagine. In Okular, d'altra parte, ho costatato che le colonne non vengono completate nella seconda metà, del file; né so, come si può forzare un orientamento orizzontale. Ho comunque riprovato a selezionare le colonne, una per volta: e cliccando, sul pulsante "seleziona", una colonna di prova l'ho selezionata schermata per schermata. Dopo di che, su Calc una copia è riuscita; sia pur in modo grossolano, perché devo ancora chiarire come far sì che in Calc il testo resti entro la colonna. Infine, quanto a Pdftotext, in Ubuntu 18.04 non lo trovo installato e Synaptic mi dice, in merito, di installare Poppler: cosicché ho provveduto per tutti i relativi pacchetti. Mi trovo però, come ulteriore applicazione offerta per aprire i file pdf, Zathura; con la quale le colonne risultano troncate in misura, ancor maggiore. -- Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/ Linee guida per postare + altro: https://wiki.documentfoundation.org/Local_Mailing_Lists/it Archivio della lista: https://listarchives.libreoffice.org/it/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [it-users] importare pdf
2018-09-08 16:06 GMT+02:00 atemp...@alice.it : > Né c'è modo dunque per, da Draw, esportarli in Calc e Base... All'origine > del mio problema, c'è l'evidentemente errata convinzione che in informatica > sia possibile la retromarcia. Giacché avevo, di alcune tabelle in MySQL, > fatto copie di sicurezza esportandole -attraverso PhpMyAdmin- in file PDF; > che meglio di quelli in Calc si aprono, sul mio smartphone. Adesso, avrei > bisogno, di riportare queste copie su MySQL (dove tali tabelle sono venute > meno): ma la retromarcia risulta, appunto, impossibile e non vedo altra via, > che quella di "copia e incolla". Non è il "fare retromarcia" che è sbagliato, quanto il fare copie di sicurezza di un'applicazione nel formato _non nativo_ dell'applicazione stessa: va sempre usato il formato proprio dell'applicazione... Se poi per comodità vuoi tenere copie in altro formato, per consultarlo su dispositivi vari va benissimo, ma pretendere di ricostruire un DB MySQL partendo da un PDF per importarlo in /Calc/Draw/Base è concettualmente sbagliato. Sarebbe stato molto più sensato esportare in CSV piuttosto che in PDF, formato importabile sia in calc che in base (e forse anche direttamente in mysql) e con quasi la stessa leggibilità di un PDF in questo caso. Detto questo, è molto difficile fornire una soluzione senza sapere di quale tipo di dati parliamo e del formato dei dati nel DB. Io di solito per estrarre (parte di un) testo da un PDF, lo apro con un lettore PDF come qpdfview e seleziono una porzione del testo, che si può poi incollare in un altro documento. Quanto sia attuabile questo procedimento, però, dipende molto dal tipo di dato contenuto nella colonna, perché il testo incollato perde gli a capo e quindi viene scritto in una sola riga, ma per ripopolare il DB dovrebbe essere sufficiente. Per fare una prova, ho preso un estratt oconto della banca: se seleziono la colonna "dare" o "avere", si ottiene velocemente qualcosa di elaborabile/importabile in un foglio di calcolo o db (una serie di numeri decimali separati da uno spazio), se seleziono la colonna "descrizione operazione"... BUM! meglio copiare ogni riga singolarmente. Dato che qpdfview si basa sulle librerie poppler, mi aspetto che la cosa sia possibile in altri lettori. In alternativa, e tenendo conto delle considerazioni fatte sopra per il ofrmato dei dati la soluzione pdftotext e successiva manipolazione via akw (più che con sed) ritengo sia l'unica altra alternativa. m2c, Stefano -- Stefano David, PhD -- Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/ Linee guida per postare + altro: https://wiki.documentfoundation.org/Local_Mailing_Lists/it Archivio della lista: https://listarchives.libreoffice.org/it/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [it-users] importare pdf
Il 09/09/18 14:04, atemp...@alice.it ha scritto: Il 08/09/2018 23:12, Valerio Messina ha scritto: On 08/09/2018 23:09, atemp...@alice.it wrote: Vedo però, su Synaptic, che Okular fa parte di KDE; mentre io mi trovo in Gnome. Nessun problema? collaborano tutti su freedesktop, per cui non ci sono problemi. Io non uso ne Gnome ne KDE e Okular va benissimo per la selezione di tabelle. Allora, resto per il momento sulla strada che mi hai consigliato tu; prima di considerare eventualmente i gentili consigli, che mi sono stati dati in seguito... Ho installato Okular (nel dubbio, selezionando tutti i pacchetti trovati su Synaptic: non mi ricordo mai, se basta selezionare il primo pacchetto della lista e poi Synaptic vede da sè, quali altri pacchetti aggiungere...). Mi imbatto però, in due questioni e la prima è che, con Okular come con qpdfview, il file me lo trovo sullo schermo -qualunque sia lo zoom- non con tutte le sue, cinque colonne; ma con la quarta colonna che compare a metà soltanto, con la quinta che non compare proprio. Aprendo invece il file pdf, con Draw, ogni cosa è al suo posto (e da questo punto di vista l'ideale sarebbe procedere, da Draw a Calc; ma mi sembra che, in Draw, non si possano selezionare le colonne). L'altra questione è: in Okular c'è un modo istantaneo per selezionare un'intera colonna, oppure occorre "Inseguire" il suo contenuto per, magari, cento schermate? Grazie in anticipo... Per elaborare file pdf; però piccoli e, soprattutto, a me serve solo il testo, io uso masterpdf. Lo scarichi, per linux, dal sito del produttore. -- Ferrari Renato Maria Linux Registered User #219791 Linux Registered Machine #104061 email: renatoferr...@tiscali.it posta certificata: renatomaria.ferrari.d...@pec.mi.omceo.it -- Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/ Linee guida per postare + altro: https://wiki.documentfoundation.org/Local_Mailing_Lists/it Archivio della lista: https://listarchives.libreoffice.org/it/users/ Privacy Policy: https://www.documentfoundation.org/privacy
Re: [it-users] importare pdf
On 09/09/18 14:04, atemp...@alice.it wrote: Okular come con qpdfview, il file me lo trovo sullo schermo -qualunque sia lo zoom- non con tutte le sue, cinque colonne; ma con la quarta colonna che compare a metà soltanto, con la quinta che non compare proprio. Se anche con lo zoom minimo (menù visualizza) non vedi tutti, è un baco del programma Aprendo invece il file pdf, con Draw, ogni cosa è al suo posto (e da questo punto di vista l'ideale sarebbe procedere, da Draw a Calc; ma mi sembra che, in Draw, non si possano selezionare le colonne). L'altra questione è: in Okular c'è un modo istantaneo per selezionare un'intera colonna, oppure occorre "Inseguire" il suo contenuto per, magari, cento schermate? se ricordo bene tenendo premuto CTRL si seleziona per colonne. Ma quante pagine hai da importare? Se sono tante allora è meglio usare poppler come ti consiglia Andrea, e poi usare un editor che abbia la selezione per colonne. -- Valerio -- Come cancellarsi: E-mail users+unsubscr...@it.libreoffice.org Problemi? https://it.libreoffice.org/supporto/mailing-lists/come-cancellarsi/ Linee guida per postare + altro: https://wiki.documentfoundation.org/Local_Mailing_Lists/it Archivio della lista: https://listarchives.libreoffice.org/it/users/ Privacy Policy: https://www.documentfoundation.org/privacy