Re: Files PDF
Il 11/10/2017 00:05, paolo ha scritto: Si in effetti concordo con te nel avere dei dubbi dato che non forniscono il sorgente. Sembra che pacchetti di questo tipo, previa valutazione, possano essere accettati nel repo non-free. Debian Policy Manual 2.2.3. The non-free archive area https://www.debian.org/doc/debian-policy/#document-index Grazie per l´interessamento. :) Paolo Per mia esperienza i deb ubuntu li evito come la peste, a meno che non sia su un sistema virtualizzato dove se va male, cancelli e rimetti di nuovo. Poi sia chiaro, ognuno è ibero di provare, basta sappia quel che fà o a cosa va incontro. -- _|_|_|_|_|_|_|_|_|_ |_|_|_|_|_|_|_|_|_|_| Simone Girardelli
Re: Files PDF
Si in effetti concordo con te nel avere dei dubbi dato che non forniscono il sorgente. Sembra che pacchetti di questo tipo, previa valutazione, possano essere accettati nel repo non-free. Debian Policy Manual 2.2.3. The non-free archive area https://www.debian.org/doc/debian-policy/#document-index Grazie per l´interessamento. :) Paolo Il 10/10/17 19:39, liste DOT girarsi AT posteo DOT eu ha scritto: Il 10/10/2017 09:31, paolo ha scritto: E' vero purtroppo le licenze sono come quelle di tanti prodotti commerciali. Un programma del genere nella sua versione free potrebbe finire nel repo non-free o e´ per policy da escludere da qualsiasi repo debian? Paolo Non saprei, i binari sono per Ubuntu, quindi Debian-based ma non Debian, oltretutto, non è concordato con gli sviluppatori Debian, cosa che aumenta i dubbi, per cui, credo sia una applicazione a sé, con un'occhio a Linux, applauso per questo, ma non mi da molta fiducia sinceramente.
Re: Files PDF
Il 10/10/2017 09:31, paolo ha scritto: E' vero purtroppo le licenze sono come quelle di tanti prodotti commerciali. Un programma del genere nella sua versione free potrebbe finire nel repo non-free o e´ per policy da escludere da qualsiasi repo debian? Paolo Non saprei, i binari sono per Ubuntu, quindi Debian-based ma non Debian, oltretutto, non è concordato con gli sviluppatori Debian, cosa che aumenta i dubbi, per cui, credo sia una applicazione a sé, con un'occhio a Linux, applauso per questo, ma non mi da molta fiducia sinceramente. -- _|_|_|_|_|_|_|_|_|_ |_|_|_|_|_|_|_|_|_|_| Simone Girardelli
Re: Files PDF
Il 10/10/2017 09:31, paolo ha scritto: E' vero purtroppo le licenze sono come quelle di tanti prodotti commerciali. Un programma del genere nella sua versione free potrebbe finire nel repo non-free o e´ per policy da escludere da qualsiasi repo debian? Paolo Non saprei, i binari sono per Ubuntu, quindi Debian-based ma non Debian, oltretutto, non è concordato con gli sviluppatori Debian, cosa che aumenta i dubbi, per cui, credo sia una applicazione a sé, con un'occhio a Linux, applauso per questo, ma non mi da molta fiducia sinceramente. -- _|_|_|_|_|_|_|_|_|_ |_|_|_|_|_|_|_|_|_|_| Simone Girardelli
Re: Files PDF
E' vero purtroppo le licenze sono come quelle di tanti prodotti commerciali. Un programma del genere nella sua versione free potrebbe finire nel repo non-free o e´ per policy da escludere da qualsiasi repo debian? Paolo Il 09/10/17 19:15, liste DOT girarsi AT posteo DOT eu ha scritto: Il 09/10/2017 19:01, paolo ha scritto: Ciao a tutti, mi permetto, per trattare pdf, di segnalare "master pdf" se non lo conoscete. https://code-industry.net/free-pdf-editor/ Spero sia d´aiuto. Paolo Licenza prevede l'uso non commerciale, e altro, vi invito a vedere la licenza, scaricandovi il pacchetto. https://code-industry.net/free-pdf-editor/
Re: Files PDF
Il 09/10/2017 19:01, paolo ha scritto: Ciao a tutti, mi permetto, per trattare pdf, di segnalare "master pdf" se non lo conoscete. https://code-industry.net/free-pdf-editor/ Spero sia d´aiuto. Paolo Licenza prevede l'uso non commerciale, e altro, vi invito a vedere la licenza, scaricandovi il pacchetto. https://code-industry.net/free-pdf-editor/ -- _|_|_|_|_|_|_|_|_|_ |_|_|_|_|_|_|_|_|_|_| Simone Girardelli
Re: Files PDF
Il 09/10/2017 19:01, paolo ha scritto: Ciao a tutti, mi permetto, per trattare pdf, di segnalare "master pdf" se non lo conoscete. https://code-industry.net/free-pdf-editor/ Spero sia d´aiuto. Paolo Licenza prevede l'uso non commerciale, e altro, vi invito a vedere la licenza, scaricandovi il pacchetto. https://code-industry.net/free-pdf-editor/ -- _|_|_|_|_|_|_|_|_|_ |_|_|_|_|_|_|_|_|_|_| Simone Girardelli
Re: Files PDF
Ciao a tutti, mi permetto, per trattare pdf, di segnalare "master pdf" se non lo conoscete. https://code-industry.net/free-pdf-editor/ Spero sia d´aiuto. Paolo Il 06/10/17 16:15, Piviul ha scritto: Il 06/10/2017 16:06, peterpunk ha scritto: On Fri, 6 Oct 2017 14:38:22 +0200 Piviul wrote: [...] Sono io che sono impedito o proprio non funziona? ok, ho capito, non c'è bisogno di dir nulla! Piviul
Re: Files PDF
Il 06/10/2017 16:06, peterpunk ha scritto: On Fri, 6 Oct 2017 14:38:22 +0200 Piviul wrote: [...] Sono io che sono impedito o proprio non funziona? ok, ho capito, non c'è bisogno di dir nulla! Piviul
Re: Files PDF
On Fri, 6 Oct 2017 14:38:22 +0200 Piviul wrote: > Scusate ma chiedo lumi non sull'OCR in generale ma sull'utilizzo > di gimagereader. Io non sono proprio riuscito a farlo funzionare > nel senso che una volta aperto il pdf con gimagereader non so cosa > fare: ho provato a selezionare, spingere tutti i bottoni ma non > sono riuscito proprio a farci nulla. Sono io che sono impedito o > proprio non funziona? > Il bottone da spingere è "Riconoscere tutto" (se non selezioni nulla) / "Riconoscere selezione" (se fai una selezione)...: http://www.hackbloc.it/gir/gir01.jpg http://www.hackbloc.it/gir/gir02.jpg http://www.hackbloc.it/gir/gir03.jpg http://www.hackbloc.it/gir/gir04.jpg peterpunk -- ,= ,-_-. =. ((_/)o o(\_)) `-'(. .)`-' \_/ printf("Mai un giorno senza una riga\n");
Re: Files PDF
Il 06/10/2017 12:32, liste DOT girarsi AT posteo DOT net ha scritto: [...] Come ti è stato suggerito, per il riconoscimento, seppur parziale del testo in un'immagine, affidati ad un OCR, il resto, a mio avviso, è aver dimestichezza con questi strumenti. Io lo uso poco o nulla, ma dipende molto dalla risoluzione dell'immagine per avere un buon contrasto del testo, perchè sostanzialmente su questo si basa l'OCR. Più l'immagine è a bassa risoluzione, peggiore è il riconoscimento del testo, e di conseguenza metterci mano leggendo di persona. Scusate ma chiedo lumi non sull'OCR in generale ma sull'utilizzo di gimagereader. Io non sono proprio riuscito a farlo funzionare nel senso che una volta aperto il pdf con gimagereader non so cosa fare: ho provato a selezionare, spingere tutti i bottoni ma non sono riuscito proprio a farci nulla. Sono io che sono impedito o proprio non funziona? Piviul
Re: Files PDF
Il 06/10/2017 08:33, Piviul ha scritto: Il 05/10/2017 17:08, peterpunk ha scritto: On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote: Se non è il DRM (che però dovrebbe darti il messaggio relativo) potrebbe essere che il contenuto proviene da una scansione (ovvero è solo grafico e non testuale) Verifica con pdfinfo e/o pdfimages In questi casi programmi come gimagereader fanno miracoli! ;-) Ho installato gimagereader; ho creato un pdf da un documento scansionato, l'ho aperto con gimagereader e poi? Sai che non sono riuscito a farci nulla? Come si fa a trasformarlo in testo? Piviul Come ti è stato suggerito, per il riconoscimento, seppur parziale del testo in un'immagine, affidati ad un OCR, il resto, a mio avviso, è aver dimestichezza con questi strumenti. Io lo uso poco o nulla, ma dipende molto dalla risoluzione dell'immagine per avere un buon contrasto del testo, perchè sostanzialmente su questo si basa l'OCR. Più l'immagine è a bassa risoluzione, peggiore è il riconoscimento del testo, e di conseguenza metterci mano leggendo di persona. -- _|_|_|_|_|_|_|_|_|_ |_|_|_|_|_|_|_|_|_|_| Simone Girardelli
Re: Files PDF
Il 06/10/2017 08:33, Piviul ha scritto: Il 05/10/2017 17:08, peterpunk ha scritto: On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote: Se non è il DRM (che però dovrebbe darti il messaggio relativo) potrebbe essere che il contenuto proviene da una scansione (ovvero è solo grafico e non testuale) Verifica con pdfinfo e/o pdfimages In questi casi programmi come gimagereader fanno miracoli! ;-) Ho installato gimagereader; ho creato un pdf da un documento scansionato, l'ho aperto con gimagereader e poi? Sai che non sono riuscito a farci nulla? Come si fa a trasformarlo in testo? Piviul Come ti è stato suggerito, per il riconoscimento, seppur parziale del testo in un'immagine, affidati ad un OCR, il resto, a mio avviso, è aver dimestichezza con questi strumenti. Io lo uso poco o nulla, ma dipende molto dalla risoluzione dell'immagine per avere un buon contrasto del testo, perchè sostanzialmente su questo si basa l'OCR. Più l'immagine è a bassa risoluzione, peggiore è il riconoscimento del testo, e di conseguenza metterci mano leggendo di persona.
Re: Files PDF
Il 05/10/2017 17:08, peterpunk ha scritto: On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote: Se non è il DRM (che però dovrebbe darti il messaggio relativo) potrebbe essere che il contenuto proviene da una scansione (ovvero è solo grafico e non testuale) Verifica con pdfinfo e/o pdfimages In questi casi programmi come gimagereader fanno miracoli! ;-) Ho installato gimagereader; ho creato un pdf da un documento scansionato, l'ho aperto con gimagereader e poi? Sai che non sono riuscito a farci nulla? Come si fa a trasformarlo in testo? Piviul
Re: Files PDF
On Thu, 5 Oct 2017 19:04:39 +0200 Lucio wrote: > Ciao, installa tesseract-oct-ita ^^^ Giusto, segnalo giusto un refuso, il pacchetto infatti è tesseract-ocr-ita Strano però che installando gimagereader - che è (solo) un frontend grafico per tesseract-ocr - il gioco delle dipendenze non abbia funzionato... A ogni modo, una volta installate le lingue, caricato il file, occorre selezionare l'area di proprio interesse (ma si può anche scegliere di processare l'intero file) e poi cliccare nel menu in alto sulla voce "Riconoscere selezione" o qualcosa del genere. Il testo verrà estrapolato e comparirà sulla destra rispetto al pdf in lavorazione, con tanto di "editor" contestuale. peterpunk -- ,= ,-_-. =. ((_/)o o(\_)) `-'(. .)`-' \_/ printf("Mai un giorno senza una riga\n");
Re: Files PDF
Il giorno 5 ottobre 2017 17:46, Portobelloha scritto: > Quando avvio il programma, mi dà un errore, dice che non ha nessun > linguaggio installato. Se vado nelle preferenze, c'è un elenco di molti > linguaggi, ma se provo a selezionare inglese ed italiano mi dà errore e > non li carica. Dice che mancano dei pacchetti ma non sò quali sono. > Ciao, installa tesseract-oct-ita per l'italiano e tesseract-ocr-eng per l'inglese. Quanto alla tua mail successiva in cui scrivevi che LibreOffice Draw può aprire il file, ti confermo che LibreOffice può aprire i PDF, il problema è capire se questo file contiene testo come immagine (e quindi avrai bisogno di un OCR come tesseract per convertirlo in testo), oppure testo vero e proprio (e allora dovresti poter fare copia-incolla da LibreOffice dopo aver importato il file PDF). Spero di essere stato utile Saluti -- Lucio Marinelli
Re: Files PDF
Il 05/10/2017 17:25, Portobello ha scritto: > Il 05/10/2017 16:40, Michele Orsenigo ha scritto: >> On gioved� 5 ottobre 2017 15:57:38 CEST Portobello wrote: >>> Buon giorno Lista, >>> >>> Utilizzo debian Stretch (Con PC Amd64). >>> L'altro giorno ho scaricato dei files pdf da un sito. >>> Il problema � che da alcuni files pdf riesco a selezionare il testo, con >>> il mouse, per fare copia ed incolla sul browser (per copiare dei link a >>> dei siti web). Da altri files pdf, invece non riesco, non funziona la >>> possibilit� di selezionare il testo, per fare copia ed incolla. >>> Uso evince, come lettore di pdf, da molti anni senza nessun problema. >>> Ho guardato anche i permessi dei files pdf, e mi sembrano a posto, sono >>> gli stessi. >>> Ieri ho provato anche altri lettori di pdf, ma la cosa non cambia. >>> Ho installato anche gv, xpdf, ed altri lettori, ma non cambia nulla. >>> Non riesco a selezionare il testo. Ma soltanto da alcuni files pdf. >>> Non so pi� che posso fare per risolvere la situazione ? >>> >>> Ciao >>> Grazie >> >> Se non � il DRM (che per� dovrebbe darti il messaggio relativo) potrebbe >> essere che il contenuto proviene da una scansione (ovvero � solo grafico e >> non >> testuale) > Si, si, ora che ci penso credo che sia una scansione in formato grafico. > A dire la verità, in questo caso posso digitare a mano le lettere del > sito sul browser (il nome non è lungo). > Ma comunque vale anche la pena fare anche altri tentativi. In futuro > potrei scaricare dei files con molte più' pagine scannerizzate e allora > sarebbe un problema. >> Verifica con pdfinfo e/o pdfimages > Qui ho provato. Ma per pdfinfo mi dà questo risultato : > Title: X.pdf > Author: Y > Producer: Microsoft: Print To PDF > CreationDate: Thu Sep 21 12:28:37 2017 CEST > ModDate:Thu Sep 21 12:28:37 2017 CEST > Tagged: no > UserProperties: no > Suspects: no > Form: none > JavaScript: no > Pages: 15 > Encrypted: no > Page size: 595.32 x 841.92 pts (A4) > Page rot: 0 > File size: 8175624 bytes > Optimized: no > PDF version:1.7 > > Per pdfimages, invece non riesco. Mi dà la lista delle opzioni da usare. > Quindi credo che non ho dato il comando giusto. > Forse si può estrarre (o convertire) una o più pagine, con le opzioni -f > e -l , ma non mi funziona, non dà nessun risultato. > Forse ci sono anche altri programmi per convertire le pagine pdf > scannerizzate in forma di immagini, al formato testo. > > Ciao > Grazie > > P.S : Anche con Libreoffice Draw riesco ad aprire il file Pdf in un formato che sembra testo, si può selezionare la riga al link del sito, come un oggetto, ma poi non riesco a fare il copia/incolla da nessuna parte. Ciao. Grazie
Re: Files PDF
Il 05/10/2017 17:08, peterpunk ha scritto: > On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote: > >> Se non � il DRM (che per� dovrebbe darti il messaggio relativo) >> potrebbe essere che il contenuto proviene da una scansione (ovvero >> � solo grafico e non testuale) >> Verifica con pdfinfo e/o pdfimages >> > > In questi casi programmi come gimagereader fanno miracoli! ;-) > > peterpunk > Ho subito installato questo programma. Quando avvio il programma, mi dà un errore, dice che non ha nessun linguaggio installato. Se vado nelle preferenze, c'è un elenco di molti linguaggi, ma se provo a selezionare inglese ed italiano mi dà errore e non li carica. Dice che mancano dei pacchetti ma non sò quali sono. Riesce a leggere il file pdf. Si può convertire da OCR a plain text, ma quando seleziono la riga con il link del sito non riesco a fare il copia per poi fare incolla sul browser o su un editor di testo. Ciao Grazie
Re: Files PDF
Il 05/10/2017 16:40, Michele Orsenigo ha scritto: > On gioved� 5 ottobre 2017 15:57:38 CEST Portobello wrote: >> Buon giorno Lista, >> >> Utilizzo debian Stretch (Con PC Amd64). >> L'altro giorno ho scaricato dei files pdf da un sito. >> Il problema � che da alcuni files pdf riesco a selezionare il testo, con >> il mouse, per fare copia ed incolla sul browser (per copiare dei link a >> dei siti web). Da altri files pdf, invece non riesco, non funziona la >> possibilit� di selezionare il testo, per fare copia ed incolla. >> Uso evince, come lettore di pdf, da molti anni senza nessun problema. >> Ho guardato anche i permessi dei files pdf, e mi sembrano a posto, sono >> gli stessi. >> Ieri ho provato anche altri lettori di pdf, ma la cosa non cambia. >> Ho installato anche gv, xpdf, ed altri lettori, ma non cambia nulla. >> Non riesco a selezionare il testo. Ma soltanto da alcuni files pdf. >> Non so pi� che posso fare per risolvere la situazione ? >> >> Ciao >> Grazie > > Se non � il DRM (che per� dovrebbe darti il messaggio relativo) potrebbe > essere che il contenuto proviene da una scansione (ovvero � solo grafico e > non > testuale) Si, si, ora che ci penso credo che sia una scansione in formato grafico. A dire la verità, in questo caso posso digitare a mano le lettere del sito sul browser (il nome non è lungo). Ma comunque vale anche la pena fare anche altri tentativi. In futuro potrei scaricare dei files con molte più' pagine scannerizzate e allora sarebbe un problema. > Verifica con pdfinfo e/o pdfimages Qui ho provato. Ma per pdfinfo mi dà questo risultato : Title: X.pdf Author: Y Producer: Microsoft: Print To PDF CreationDate: Thu Sep 21 12:28:37 2017 CEST ModDate:Thu Sep 21 12:28:37 2017 CEST Tagged: no UserProperties: no Suspects: no Form: none JavaScript: no Pages: 15 Encrypted: no Page size: 595.32 x 841.92 pts (A4) Page rot: 0 File size: 8175624 bytes Optimized: no PDF version:1.7 Per pdfimages, invece non riesco. Mi dà la lista delle opzioni da usare. Quindi credo che non ho dato il comando giusto. Forse si può estrarre (o convertire) una o più pagine, con le opzioni -f e -l , ma non mi funziona, non dà nessun risultato. Forse ci sono anche altri programmi per convertire le pagine pdf scannerizzate in forma di immagini, al formato testo. Ciao Grazie
Re: Files PDF
Il 05/ott/2017 17:15, "peterpunk"ha scritto: On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote: > Se non è il DRM (che però dovrebbe darti il messaggio relativo) > potrebbe essere che il contenuto proviene da una scansione (ovvero > è solo grafico e non testuale) > Verifica con pdfinfo e/o pdfimages > In questi casi programmi come gimagereader fanno miracoli! ;-) Andrò a vedere gimagereader che non conoscevo, grazie; Dimenticavo di dire che il trattamento del PDF può essere fatto anche con GIMP (selezionando una pagina alla volta se il documento e multipagina) ma mi sembrava che la domanda iniziale fosse legata alla selezione di testo peterpunk -- ,= ,-_-. =. ((_/)o o(\_)) `-'(. .)`-' \_/ printf("Mai un giorno senza una riga\n"); Ciao, Giuliano
Re: Files PDF
On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote: > Se non è il DRM (che però dovrebbe darti il messaggio relativo) > potrebbe essere che il contenuto proviene da una scansione (ovvero > è solo grafico e non testuale) > Verifica con pdfinfo e/o pdfimages > In questi casi programmi come gimagereader fanno miracoli! ;-) peterpunk -- ,= ,-_-. =. ((_/)o o(\_)) `-'(. .)`-' \_/ printf("Mai un giorno senza una riga\n");
Re: Files PDF
On giovedì 5 ottobre 2017 15:57:38 CEST Portobello wrote: > Buon giorno Lista, > > Utilizzo debian Stretch (Con PC Amd64). > L'altro giorno ho scaricato dei files pdf da un sito. > Il problema è che da alcuni files pdf riesco a selezionare il testo, con > il mouse, per fare copia ed incolla sul browser (per copiare dei link a > dei siti web). Da altri files pdf, invece non riesco, non funziona la > possibilità di selezionare il testo, per fare copia ed incolla. > Uso evince, come lettore di pdf, da molti anni senza nessun problema. > Ho guardato anche i permessi dei files pdf, e mi sembrano a posto, sono > gli stessi. > Ieri ho provato anche altri lettori di pdf, ma la cosa non cambia. > Ho installato anche gv, xpdf, ed altri lettori, ma non cambia nulla. > Non riesco a selezionare il testo. Ma soltanto da alcuni files pdf. > Non so più che posso fare per risolvere la situazione ? > > Ciao > Grazie Se non è il DRM (che però dovrebbe darti il messaggio relativo) potrebbe essere che il contenuto proviene da una scansione (ovvero è solo grafico e non testuale) Verifica con pdfinfo e/o pdfimages Ciao -- Michele Orsenigo post...@orsenigo.it
Re: Files PDF
Il 05/ott/2017 16:18, "Portobello"ha scritto: Buon giorno Lista, Ciao Portobello, in attesa di risposte più esaustive Utilizzo debian Stretch (Con PC Amd64). L'altro giorno ho scaricato dei files pdf da un sito. Il problema è che da alcuni files pdf riesco a selezionare il testo, con il mouse, per fare copia ed incolla sul browser (per copiare dei link a dei siti web). Da altri files pdf, invece non riesco, non funziona la possibilità di selezionare il testo, per fare copia ed incolla. . Non so più che posso fare per risolvere la situazione ? Credo succeda a tutti; il formato PDF è un contenitore che può avere all'interno testo, immagini, ecc. Il testo può essere selezionato, le immagini no (presumo che il "testo" che vorresti selezionare non è tale, bensì un'immagine); Adesso aspettiamo ed usufruirò anch'io di spiegazioni più complete Ciao Grazie Ciao, Giuliano