Re: Convertire pdf in bianco e nero

2021-06-29 Per discussione Marco Bodrato

Il 2021-06-27 23:56 Davide Meloni ha scritto:

Il 25/06/21 11:18, Marco Bodrato ha scritto:
Sì, in Gimp, Immagine -> Modalità e se si sceglie "indicizzata" c'è 
tra le opzioni "tavolozza bianco e nero (1 bit)" che è quello veniva 
richiesto.


Ringrazio tutti per l'interessamento.
Ho provato tutti, o quasi, i suggerimenti proposti ma questo è quello
che ha dato i migliori risultati.


Felice di esserti stato utile, e dire che avevo scritto il mio messaggio 
quasi più "per completezza di informazione" che con la speranza che 
fosse la proposta più pratica :-D



Non ho utilizzato però la tavolozza a 1 bit ma quella ottimizzata a 3
colori, al fine di migliorare la leggibilità. Certo, lo sfondo tende
un po' al verdino ma pazienza...


Già, come dicevo, per ottenere una cosa leggibile a due colori spesso 
bisogna pre-lavorare l'immagine di partenza. Se poi in partenza il 
foglio non è stato illuminato in maniera uniforme (non è l'immagine che 
viene da uno scanner, ma una fotografia) capita anche che la lavorazione 
necessaria possa essere decisamente impegnativa!


Comunque, viva Gimp!
Mi trovo giusto ora da "stampare-firmare-ridigitalizzare-rispedire" due 
documenti da 11 pagine l'uno con una bella manciata di punti sparsi dove 
apporre il mio scarabocchio e... vediamo se indovinate come lo farò? :-)


Ĝis,
m



Re: Convertire pdf in bianco e nero

2021-06-27 Per discussione Davide Meloni

Il 25/06/21 11:18, Marco Bodrato ha scritto:
Sì, in Gimp, Immagine -> Modalità e se si sceglie "indicizzata" c'è tra 
le opzioni "tavolozza bianco e nero (1 bit)" che è quello veniva richiesto.


Ringrazio tutti per l'interessamento.
Ho provato tutti, o quasi, i suggerimenti proposti ma questo è quello 
che ha dato i migliori risultati.
Non ho utilizzato però la tavolozza a 1 bit ma quella ottimizzata a 3 
colori, al fine di migliorare la leggibilità. Certo, lo sfondo tende un 
po' al verdino ma pazienza...
Sono passato dai circa 15,4 mega agli 1,8; con la tavolozza 1 bit avrei 
ottenuto un file da circa 600 kB ma la leggibilità era difficoltosa.
Per chi lo ha domandato devo solo conservare dei documenti il cui 
originale devo poi restituire (è tempo di dichiarazioni).


Grazie ancora,
Davide



Re: Convertire pdf in bianco e nero

2021-06-27 Per discussione Davide Meloni

Il 25/06/21 11:18, Marco Bodrato ha scritto:
Sì, in Gimp, Immagine -> Modalità e se si sceglie "indicizzata" c'è tra 
le opzioni "tavolozza bianco e nero (1 bit)" che è quello veniva richiesto.


Ringrazio tutti per l'interessamento.
Ho provato tutti, o quasi, i suggerimenti proposti ma questo è quello 
che ha dato i migliori risultati.
Non ho utilizzato però la tavolozza a 1 bit ma quella ottimizzata a 3 
colori, al fine di migliorare la leggibilità. Certo, lo sfondo tende un 
po' al verdino ma pazienza...
Sono passato dai circa 15,4 mega agli 1,8; con la tavolozza 1 bit avrei 
ottenuto un file da circa 600 kB ma la leggibilità era difficoltosa.
Per chi lo ha domandato devo solo conservare dei documenti il cui 
originale devo poi restituire (è tempo di dichiarazioni).


Grazie ancora,
Davide



Re: Convertire pdf in bianco e nero

2021-06-25 Per discussione Marco Ciampa
On Thu, Jun 24, 2021 at 09:03:01AM +0200, Paolo Redælli wrote:
> 
> Il 24/06/21 08:48, Marco Ciampa ha scritto:
> > On Tue, Jun 22, 2021 at 06:56:21PM +0200, Davide Meloni wrote:
> > > Buonasera.
> > > Generalmente scansiono i documenti di testo nella modalità "bianco e nero"
> > > (non scala di grigi) al fine di ottenere un file quanto più leggero
> > > possibile.
> > Sarebbe utile sapere il perché. Se è per uso archiviazione documentale
> > sappi che lo standard è usare :
> > 
> > 1) 400dpi
> 
> Che risoluzione insolita... nei dispositivi che ho visto negli anni ho quasi
> sempre visto 150, 300, 600, 1200dpi. Un tempo c'era anche 75dpi, quella dei
> fax "bassa qualità" ma oramai è in disuso.
> 
> 400dpi credo di non averli mai visti... son riportati in qualche standard?

Si come ho detto riportato anche ad una conferenza di catalogatori, ma
ora come ora non so risalire allo standard...

-- 

Saluton,
Marco Ciampa



Re: Convertire pdf in bianco e nero

2021-06-25 Per discussione Marco Bodrato

Ciao,

Il Mer, 23 Giugno 2021 7:42 pm, Davide Prina ha scritto:

On 22/06/21 19:57, Filippo Dal Bosco - wrote:

gimp ha una opzione ( mai usata) per convertire immagini a colori in
scala di grigi.


Sì, in Gimp, Immagine -> Modalità e se si sceglie "indicizzata" c'è tra 
le opzioni "tavolozza bianco e nero (1 bit)" che è quello veniva 
richiesto.



gimp gestisce anche il formato pdf



io ho usato alcune volte questa funzionalità, ad esempio per modificare
un PDF.
Il risultato però non è eccellente poiché esportando in formato PDF
l'immagine resta un po' sfocata e alla fine viene ad occupare più 
spazio

di quello necessario.


Se il PDF di partenza era vettoriale (testo), Gimp lo trasforma in 
immagine per punti e l'effetto è quello: ottenere un risultato "un po' 
sfocato" e più pesante dell'originale.
Se però l'immagine di partenza è essa stessa una digitalizzazione 
"fotografica", come sembrerebbe nello scenario proposto, e si sceglie 
una risoluzione adeguata, il risultato può essere decisamente buono.


In più lavorando coi filtri (curve, contrasti, luminosità, soglie... 
ognuno usi quello che preferisce) si può migliorare parecchio il 
risultato finale che sarà 1 bit per punto, evitando che un grigio di 
fondo si trasformi in un "dithering" di inutili puntini sparsi per il 
documento o che alcune lettere o righe un poco sbiadite del documento 
originale "dimagriscano" troppo fino a sparire. Se c'è da lavorare di 
fino sulla visibilità del risultato finale, con Gimp si può fare.


Il 2021-06-23 20:10 Davide Prina ha scritto:

On 23/06/21 19:42, Davide Meloni wrote:
Mentre Gimp suggerito da Filippo non mi pare che operi su file di più 
pagine (ne ho 36).


in realtà gimp lo puoi anche eseguire a riga di comando, senza
interfaccia utente.
In questo modo puoi fargli processare più pagine.


Quando si chiede a Gimp di importare un PDF, anche da interfaccia 
grafica, si può richiedere di importare tutte le pagine. In questo caso 
tutte le pagine vengono importate su una singola immagine con più 
livelli.
Se si ha l'accortezza, riesportando, di ricordare a Gimp di esportare i 
livelli come pagine, si ottiene nuovamente un PDF con molte pagine. Se 
non ricordo male, bisogna però specificare di "girare l'ordine delle 
pagine" altrimenti si ottengono le pagine dall'ultima alla prima...


Detto ciò (che Gimp è in grado di assolvere al compito richiesto), di 
certo ci sono programmi dedicati specificamente alla manipolazione dei 
PDF che possono far meglio.


Anche solo decidendo di lavorare con Gimp, talvolta mi è capitato di 
usare prima "pdfimages" per estrarre dal PDF le immagini, esattamente 
con la risoluzione con la quale erano state generate, per evitare di 
riscalare durante l'importazione in Gimp che rischia di perdere qualità 
o efficienza.


Ĝis,
m



Re: Convertire pdf in bianco e nero

2021-06-24 Per discussione Paolo Redælli



Il 24/06/21 08:48, Marco Ciampa ha scritto:

On Tue, Jun 22, 2021 at 06:56:21PM +0200, Davide Meloni wrote:

Buonasera.
Generalmente scansiono i documenti di testo nella modalità "bianco e nero"
(non scala di grigi) al fine di ottenere un file quanto più leggero
possibile.

Sarebbe utile sapere il perché. Se è per uso archiviazione documentale
sappi che lo standard è usare :

1) 400dpi


Che risoluzione insolita... nei dispositivi che ho visto negli anni ho 
quasi sempre visto 150, 300, 600, 1200dpi. Un tempo c'era anche 75dpi, 
quella dei fax "bassa qualità" ma oramai è in disuso.


400dpi credo di non averli mai visti... son riportati in qualche standard?



Re: Convertire pdf in bianco e nero

2021-06-24 Per discussione Marco Ciampa
On Tue, Jun 22, 2021 at 06:56:21PM +0200, Davide Meloni wrote:
> Buonasera.
> Generalmente scansiono i documenti di testo nella modalità "bianco e nero"
> (non scala di grigi) al fine di ottenere un file quanto più leggero
> possibile.

Sarebbe utile sapere il perché. Se è per uso archiviazione documentale
sappi che lo standard è usare :

1) 400dpi
2) compressione fax CCITT gruppo 4 o altro (vedi sotto)
3) profondità immagini 1 bit
4) incapsulamento tiff (ma lo stesso si può fare con il formato contenitore pdf)

recentemente è uscito un formato (sono scaduti i diritti) di compressione
che non ricordo che è ancora migliore del CCITT. Credo che lo supporti
nativamente djpdf.

Strumenti consigliati quindi:

- GIMP
- Imagemagick
- Scan Taylor (o S. T. Advanced)

ma soprattutto:

- djpdf che trovi su flatpak con il supporto di un mucchio di lingue
(compreso l'Esperanto!) per la procedura di OCR necessaria per ottenere
dei pdf il cui testo possa essere copiato.

https://flathub.org/apps/details/com.github.unrud.djpdf
https://github.com/Unrud/djpdf

Facendo: flatpak search djpdf

Ecco il risultato:

Name Description
  Application ID   Version 
Branch Remotes
OCR Yoruba   OCR extension for Yoruba language (yor)
  com.github.unrud.djpdf.OCR.Yor   
stable flathub
OCR Yiddish  OCR extension for Yiddish language (yid)   
  com.github.unrud.djpdf.OCR.Yid   
stable flathub
OCR Vietnamese   OCR extension for Vietnamese language (vie)
  com.github.unrud.djpdf.OCR.Vie   
stable flathub
OCR Uzbek - Cyrilic  OCR extension for Uzbek - Cyrilic language 
(uzb_cyrl)com.github.unrud.djpdf.OCR.UzbCyrl
   stable flathub
OCR UzbekOCR extension for Uzbek language (uzb) 
  com.github.unrud.djpdf.OCR.Uzb   
stable flathub
OCR Urdu OCR extension for Urdu language (urd)  
  com.github.unrud.djpdf.OCR.Urd   
stable flathub
OCR UkrainianOCR extension for Ukrainian language (ukr) 
  com.github.unrud.djpdf.OCR.Ukr   
stable flathub
OCR Uighur; Uyghur   OCR extension for Uighur; Uyghur language 
(uig)  com.github.unrud.djpdf.OCR.Uig   
stable flathub
OCR Turkish  OCR extension for Turkish language (tur)   
  com.github.unrud.djpdf.OCR.Tur   
stable flathub
OCR TongaOCR extension for Tonga language (ton) 
  com.github.unrud.djpdf.OCR.Ton   
stable flathub
OCR Tigrinya OCR extension for Tigrinya language (tir)  
  com.github.unrud.djpdf.OCR.Tir   
stable flathub
OCR Thai OCR extension for Thai language (tha)  
  com.github.unrud.djpdf.OCR.Tha   
stable flathub
OCR Tagalog (new - Filipino) OCR extension for Tagalog (new - Filipino) 
language (tgl)com.github.unrud.djpdf.OCR.Tgl
   stable flathub
OCR TajikOCR extension for Tajik language (tgk) 
  com.github.unrud.djpdf.OCR.Tgk   
stable flathub
OCR Telugu   OCR extension for Telugu language (tel)
  com.github.unrud.djpdf.OCR.Tel   
stable flathub
OCR TatarOCR extension for Tatar language (tat) 
  com.github.unrud.djpdf.OCR.Tat   
stable flathub
OCR TamilOCR extension for Tamil language (tam) 
  com.github.unrud.djpdf.OCR.Tam   
stable flathub
OCR Syriac   OCR extension for Syriac language (syr)
  com.github.unrud.djpdf.OCR.Syr   
stable flathub
OCR Swedish  OCR extension for Swedish language (swe)   
  com.github.unrud.djpdf.OCR.Swe   
stable flathub
OCR Swahili  OCR extension for Swahili language (swa)   
  com.github.unrud.djpdf.OCR.Swa   
stable flathub
OCR SundaneseOCR extension for Sundanese language (sun) 
  com.github.unrud.djpdf.OCR.Sun   
stable flathub
OCR Serbian - 

Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Piviul

Il 23/06/21 19:42, Davide Meloni ha scritto:

Il 23/06/21 08:28, Piviul ha scritto:
in che senso? Io mi trovo molto bene con ghostscript con risultati 
ottimi; ad esempio per convertirli in scala di grigi uso un comando 
tipo:


gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook 
-dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages 
-sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray 
-dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf"


Con questo comando sono passato da 15,4 MB a 6,8.

Con gscan2pdf suggerito da Valerio e risoluzione a 150, 8,8 MB. Se 
rimuovesse il colore forse qualcosa la si recupererebbe.


Mentre Gimp suggerito da Filippo non mi pare che operi su file di più 
pagine (ne ho 36).


Comunque io non voglio la scala di grigi, voglio il bianco e nero che 
hanno gli scanner. I font saranno anche meno definiti, comunque 
leggibili, ma il file pesa decisamente meno.

AFAIK "il bianco e nero che hanno gli scanner" è la scala di grigi

Piviul



Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Davide Prina

On 23/06/21 19:42, Davide Meloni wrote:
Mentre Gimp suggerito da Filippo non mi pare che operi su file di più 
pagine (ne ho 36).


in realtà gimp lo puoi anche eseguire a riga di comando, senza 
interfaccia utente.

In questo modo puoi fargli processare più pagine.

Lo avevo usato anni fa in questo modo per applicare determinate 
operazioni su un numero molto elevato di file immagine.


Ciao
Davide
--
Strumenti per l'ufficio: https://www.libreoffice.org
GNU/Linux User: 302090: http://counter.li.org
Non autorizzo la memorizzazione del mio indirizzo su outlook




Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Davide Prina

On 22/06/21 18:56, Davide Meloni wrote:

Ora ho ricevuto un documento di diverse pagine scansionato nella 
modalitᅵ "colore" che vorrei ridurre: > ᅵ possibile convertirlo nella

modalitᅵ "bianco e nero"? Sapete come fare?


Oltre a quanto ti hanno già suggerito, se il PDF contiene molto testo e 
la scansione è buona, allora puoi provare a trasformarlo in un testo con 
un lettore di OCR, estrarre le immagini e ricrearti il file.
Però dipende molto dal layout (che perdi) e la cosa potrebbe diventare 
molto difficile da realizzare per layout complessi.


Avevo fatto delle prove tempo fa e in alcuni casi il risultato ottenuto 
era buono. Non mi ricordo quale OCR, presente in Debian, abbia usato 
all'epoca (forse tesseract-ocr?)


Poi anche con questo dovresti poter convertire un PDF da colori in 
bianco e nero:

$ apt show mupdf-tools

Qui trovi un po' di soluzioni al problema:
https://unix.stackexchange.com/questions/93959/how-to-convert-a-color-pdf-to-black-white
https://forums.linuxmint.com/viewtopic.php?t=285720
...


Ho provato soluzioni come quella qui illustrata
https://itsfoss.com/compress-pdf-linux/
che utilizza ghostscript ma senza risultati accettabili.


c'è anche la possibilità di comprimere un PDF e ne ho sperimentati vari.
Il miglior risultato l'ho ottenuto usando qpdf e i seguenti parametri:
$ qpdf --recompress-flate --compression-level=9 --optimize-images \
  $IN.pdf $OUT.pdf

però dipende dalla sorgente: se chi ha creato il PDF ha già compresso il 
contenuto, allora puoi ottenere un file più grande dell'originale, ma in 
vari casi ho ottenuto una riduzione veramente consistente.


Ciao
Davide
--
Browser: http://www.mozilla.org/products/firefox
GNU/Linux User: 302090: http://counter.li.org
Non autorizzo la memorizzazione del mio indirizzo su outlook




Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Davide Prina

On 22/06/21 19:57, Filippo Dal Bosco - wrote:


gimp ha una opzione ( mai usata) per convertire immagini a colori in
scala di grigi.

gimp gestisce anche il formato pdf


io ho usato alcune volte questa funzionalità, ad esempio per modificare 
un PDF.
Il risultato però non è eccellente poiché esportando in formato PDF 
l'immagine resta un po' sfocata e alla fine viene ad occupare più spazio 
di quello necessario.


Ciao
Davide
--
Dizionari: http://linguistico.sourceforge.net/wiki
$
Perché microsoft continua a compiere azioni illegali?:
http://linguistico.sf.net/wiki/doku.php?id=traduzioni:ms_illegal
GNU/Linux User: 302090: http://counter.li.org
Non autorizzo la memorizzazione del mio indirizzo su outlook




Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Davide Meloni

Il 23/06/21 08:28, Piviul ha scritto:
in che senso? Io mi trovo molto bene con ghostscript con risultati 
ottimi; ad esempio per convertirli in scala di grigi uso un comando tipo:


gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook 
-dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages 
-sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray 
-dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf"


Con questo comando sono passato da 15,4 MB a 6,8.

Con gscan2pdf suggerito da Valerio e risoluzione a 150, 8,8 MB. Se 
rimuovesse il colore forse qualcosa la si recupererebbe.


Mentre Gimp suggerito da Filippo non mi pare che operi su file di più 
pagine (ne ho 36).


Comunque io non voglio la scala di grigi, voglio il bianco e nero che 
hanno gli scanner. I font saranno anche meno definiti, comunque 
leggibili, ma il file pesa decisamente meno.


Grazie per ora,
Davide



Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Piviul

Il 22/06/21 18:56, Davide Meloni ha scritto:

[...]
Ho provato soluzioni come quella qui illustrata
https://itsfoss.com/compress-pdf-linux/
che utilizza ghostscript ma senza risultati accettabili.


in che senso? Io mi trovo molto bene con ghostscript con risultati 
ottimi; ad esempio per convertirli in scala di grigi uso un comando tipo:


gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook 
-dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages 
-sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray 
-dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf"


Piviul



Re: Convertire pdf in bianco e nero

2021-06-22 Per discussione Filippo Dal Bosco -
Il giorno Tue, 22 Jun 2021 18:56:21 +0200
Davide Meloni  ha scritto:


> 
> Ora ho ricevuto un documento di diverse pagine scansionato nella 
> modalitᅵ "colore" che vorrei ridurre: ᅵ possibile convertirlo
> nella modalitᅵ "bianco e nero"? Sapete come fare?

gimp ha una opzione ( mai usata) per convertire immagini a colori in
scala di grigi.

gimp gestisce anche il formato pdf

-- 
Filippo



Re: Convertire pdf in bianco e nero

2021-06-22 Per discussione valerio




Il 22/06/21 18:56, Davide Meloni ha scritto:

Buonasera.
Generalmente scansiono i documenti di testo nella modalitᅵ "bianco e 
nero" (non scala di grigi) al fine di ottenere un file quanto piᅵ 
leggero possibile.


Ora ho ricevuto un documento di diverse pagine scansionato nella 
modalitᅵ "colore" che vorrei ridurre: ᅵ possibile convertirlo nella 
modalitᅵ "bianco e nero"? Sapete come fare?


Ho provato soluzioni come quella qui illustrata
https://itsfoss.com/compress-pdf-linux/
che utilizza ghostscript ma senza risultati accettabili.

Grazie,
Davide


ciao,
hai mai usato gscan2pdf?
non l'ho mai usato per quello che vuoi fare tu, ma penso che abbia molte 
potenzialità


valerio



Convertire pdf in bianco e nero

2021-06-22 Per discussione Davide Meloni

Buonasera.
Generalmente scansiono i documenti di testo nella modalitᅵ "bianco e 
nero" (non scala di grigi) al fine di ottenere un file quanto piᅵ 
leggero possibile.


Ora ho ricevuto un documento di diverse pagine scansionato nella 
modalitᅵ "colore" che vorrei ridurre: ᅵ possibile convertirlo nella 
modalitᅵ "bianco e nero"? Sapete come fare?


Ho provato soluzioni come quella qui illustrata
https://itsfoss.com/compress-pdf-linux/
che utilizza ghostscript ma senza risultati accettabili.

Grazie,
Davide