Re: convertir une image jpeg en tiff

2017-04-06 Par sujet G2PC
Le 06/04/2017 à 00:23, JF Straeten a écrit :
> Re,
>
> On Wed, Apr 05, 2017 at 08:39:11PM +0400, MALGORNd wrote:
>
> [...]
>> Par contre, je ne comprends pas l'intérêt de passer de .JPG en .TIFF
>> si ce n'est pour être compatible avec une application particulière.
> C'est tout à fait cela, en fait ; en tout cas, c'est ce que j'ai
> compris de la demande de Bernard : tesseract ne mangerait pas le jpeg
> en entrée (pas vérifié ; j'utilise toujours du pnm).
>
> A+
Comme dit, le logiciel OCR tesseract semble fonctionner correctement.

C'est plus le traitement de l'image, avant le scann de reconnaissance,
qui semble nécessaire, pour avoir une image sur fond plus blanc, et,
caractères plus noirs.



Re: convertir une image jpeg en tiff

2017-04-05 Par sujet JF Straeten

Re,

On Wed, Apr 05, 2017 at 08:39:11PM +0400, MALGORNd wrote:

[...]
> Par contre, je ne comprends pas l'intérêt de passer de .JPG en .TIFF
> si ce n'est pour être compatible avec une application particulière.

C'est tout à fait cela, en fait ; en tout cas, c'est ce que j'ai
compris de la demande de Bernard : tesseract ne mangerait pas le jpeg
en entrée (pas vérifié ; j'utilise toujours du pnm).

A+

-- 

JFS.



Re: convertir une image jpeg en tiff

2017-04-05 Par sujet Eric Degenetais
Par contre certains logiciels peuvent *détruire* de l'information comme le
module de gêne automatique à la saisie d'android qui m'a transformé "AMHA"
en achat ^^

Le 5 avr. 2017 6:59 PM, "Eric Degenetais"  a écrit :

Achat,  c'est forcément une méthode d'interpolation sans gain d'info, à
part dans les séries télé policières pseudo-scientifiques les ordinateurs
ne peuvent pas inventer les pixels qui n'étaient pas dans le fichier
d'origine...

Le 5 avr. 2017 6:39 PM, "MALGORNd"  a écrit :

>
>
> On 05/04/2017 15:32, Jean Bernon wrote:
> > Perso j'utilise les outils graphiques essentiellement sous Gnome. Mon
> > menu imagemagick n'a jamais marché. Quelqu'un a-t-il une idée sur ce
> point ?
> > Sinon la conversion de jpeg à tiff se fait en quelques clics avec Gimp :
> > ouvrir le fichier jpeg, choisir "fichier" "export as...", choisir tiff,
> > et c'est fini.
> >
>
> >
> > Plutôt qu'un problème de commande de l'OCR, c'est plutôt un problème
> > d'image, car, le fond beige de l'image ( découpée d'un " vieux "
> journal
> > ) empêche la reconnaissance de caractères.
> > Il faudrait pouvoir éclaircir l'image, enlever le fond beige pour
> garder
> > un fond blanc, accentuer le texte en noir également.
> > Le problème semble plus être de l'ordre de la bonne utilisation de
> Gimp
> > que de tesseract.
> >
> > Bonne après midi.
>
> Bonsoir,
>
> je viens de découvrir le bouton "Reply List" et si je n'ai pas pris le
> temps d'aller sur le forum, j'ai suivi avec intérêt la discussion.
>
> J'interviens pour signaler que j'obtiens de bons résultats pour
> éclaircir, rattraper une image avec gThumb. Il y a même des préréglages
> qui suffisent le plus souvent.
>
> J'aime bien aussi PINTA, plus rapide que GIMP.
>
> Par contre, je ne comprends pas l'intérêt de passer de .JPG en .TIFF si
> ce n'est pour être compatible avec une application particulière.
>
> Le format .TIFF a toujours été plus complet que .JPEG et partir d'une
> image .TIFF (ou .RAW ?) pour la réduire me semble possible en nuançant
> la qualité obtenue.par contre comment se feraient les compléments du
> JPG vers le .TIFF ? Quelles extrapolations?
>
> S'il ne s'agit pas d'un simple jeu d'écritures entre applications et que
> vous obtenez + de pixels ou des pixels différents bref, un réel
> changement de qualité de l'image,je veux bien abuser de votre sens
> pédagogique.
>
> Bien à vous.
>
>
>
>


Re: convertir une image jpeg en tiff

2017-04-05 Par sujet Eric Degenetais
Achat,  c'est forcément une méthode d'interpolation sans gain d'info, à
part dans les séries télé policières pseudo-scientifiques les ordinateurs
ne peuvent pas inventer les pixels qui n'étaient pas dans le fichier
d'origine...

Le 5 avr. 2017 6:39 PM, "MALGORNd"  a écrit :

>
>
> On 05/04/2017 15:32, Jean Bernon wrote:
> > Perso j'utilise les outils graphiques essentiellement sous Gnome. Mon
> > menu imagemagick n'a jamais marché. Quelqu'un a-t-il une idée sur ce
> point ?
> > Sinon la conversion de jpeg à tiff se fait en quelques clics avec Gimp :
> > ouvrir le fichier jpeg, choisir "fichier" "export as...", choisir tiff,
> > et c'est fini.
> >
>
> >
> > Plutôt qu'un problème de commande de l'OCR, c'est plutôt un problème
> > d'image, car, le fond beige de l'image ( découpée d'un " vieux "
> journal
> > ) empêche la reconnaissance de caractères.
> > Il faudrait pouvoir éclaircir l'image, enlever le fond beige pour
> garder
> > un fond blanc, accentuer le texte en noir également.
> > Le problème semble plus être de l'ordre de la bonne utilisation de
> Gimp
> > que de tesseract.
> >
> > Bonne après midi.
>
> Bonsoir,
>
> je viens de découvrir le bouton "Reply List" et si je n'ai pas pris le
> temps d'aller sur le forum, j'ai suivi avec intérêt la discussion.
>
> J'interviens pour signaler que j'obtiens de bons résultats pour
> éclaircir, rattraper une image avec gThumb. Il y a même des préréglages
> qui suffisent le plus souvent.
>
> J'aime bien aussi PINTA, plus rapide que GIMP.
>
> Par contre, je ne comprends pas l'intérêt de passer de .JPG en .TIFF si
> ce n'est pour être compatible avec une application particulière.
>
> Le format .TIFF a toujours été plus complet que .JPEG et partir d'une
> image .TIFF (ou .RAW ?) pour la réduire me semble possible en nuançant
> la qualité obtenue.par contre comment se feraient les compléments du
> JPG vers le .TIFF ? Quelles extrapolations?
>
> S'il ne s'agit pas d'un simple jeu d'écritures entre applications et que
> vous obtenez + de pixels ou des pixels différents bref, un réel
> changement de qualité de l'image,je veux bien abuser de votre sens
> pédagogique.
>
> Bien à vous.
>
>
>
>


Re: convertir une image jpeg en tiff

2017-04-05 Par sujet MALGORNd


On 05/04/2017 15:32, Jean Bernon wrote:
> Perso j'utilise les outils graphiques essentiellement sous Gnome. Mon
> menu imagemagick n'a jamais marché. Quelqu'un a-t-il une idée sur ce point ?
> Sinon la conversion de jpeg à tiff se fait en quelques clics avec Gimp :
> ouvrir le fichier jpeg, choisir "fichier" "export as...", choisir tiff,
> et c'est fini.
> 

> 
> Plutôt qu'un problème de commande de l'OCR, c'est plutôt un problème
> d'image, car, le fond beige de l'image ( découpée d'un " vieux " journal
> ) empêche la reconnaissance de caractères.
> Il faudrait pouvoir éclaircir l'image, enlever le fond beige pour garder
> un fond blanc, accentuer le texte en noir également.
> Le problème semble plus être de l'ordre de la bonne utilisation de Gimp
> que de tesseract.
> 
> Bonne après midi.

Bonsoir,

je viens de découvrir le bouton "Reply List" et si je n'ai pas pris le
temps d'aller sur le forum, j'ai suivi avec intérêt la discussion.

J'interviens pour signaler que j'obtiens de bons résultats pour
éclaircir, rattraper une image avec gThumb. Il y a même des préréglages
qui suffisent le plus souvent.

J'aime bien aussi PINTA, plus rapide que GIMP.

Par contre, je ne comprends pas l'intérêt de passer de .JPG en .TIFF si
ce n'est pour être compatible avec une application particulière.

Le format .TIFF a toujours été plus complet que .JPEG et partir d'une
image .TIFF (ou .RAW ?) pour la réduire me semble possible en nuançant
la qualité obtenue.par contre comment se feraient les compléments du
JPG vers le .TIFF ? Quelles extrapolations?

S'il ne s'agit pas d'un simple jeu d'écritures entre applications et que
vous obtenez + de pixels ou des pixels différents bref, un réel
changement de qualité de l'image,je veux bien abuser de votre sens
pédagogique.

Bien à vous.





Re: convertir une image jpeg en tiff

2017-04-05 Par sujet Jean Bernon
Perso j'utilise les outils graphiques essentiellement sous Gnome. Mon menu 
imagemagick n'a jamais marché. Quelqu'un a-t-il une idée sur ce point ? 
Sinon la conversion de jpeg à tiff se fait en quelques clics avec Gimp : ouvrir 
le fichier jpeg, choisir "fichier" "export as...", choisir tiff, et c'est fini. 

- Mail original -

> De: "G2PC" <g...@visionduweb.com>
> À: debian-user-french@lists.debian.org
> Envoyé: Mercredi 5 Avril 2017 12:56:06
> Objet: Re: convertir une image jpeg en tiff

> Le 04/04/2017 à 18:24, JF Straeten a écrit :
> > Re,
> >
> > On Tue, Apr 04, 2017 at 05:56:23PM +0200, G2PC wrote:
> >
> > [...]
> >> tesseract image.tif sortie -l fra
> >> Tesseract Open Source OCR Engine v3.04.01 with Leptonica
> >> Error opening data file
> >> /usr/share/tesseract-ocr/tessdata/fra.traineddata
> >> Please make sure the TESSDATA_PREFIX environment variable is set
> >> to the
> >> parent directory of your "tessdata" directory.
> >> Failed loading language 'fra'
> >> Tesseract couldn't load any languages!
> >> Could not initialize tesseract.
> > faut installer tesseract-ocr-fra qui contient les fichiers de
> > langue
> > spécifiques au français...
> >
> > Ou alors procéder sans le '-l fra' ; parfois ça suffit...
> > A+
> Bonjour
> Je ne suis pas convaincu que ajouter les fichiers de langue change
> quoi
> que ce soit.
> J'ai utilisé l'image de journal qui a un fond beige : image.jpg
> Conversion en .tif : convert image.jpg image.tif

> tesseract image.tif sortie -l fra
> Le fichier de sortie est vide.

> C'est donc le même résultat qu'avec la commande sans le pack de
> langue.
> tesseract image.tif sortie

> Plutôt qu'un problème de commande de l'OCR, c'est plutôt un problème
> d'image, car, le fond beige de l'image ( découpée d'un " vieux "
> journal
> ) empêche la reconnaissance de caractères.
> Il faudrait pouvoir éclaircir l'image, enlever le fond beige pour
> garder
> un fond blanc, accentuer le texte en noir également.
> Le problème semble plus être de l'ordre de la bonne utilisation de
> Gimp
> que de tesseract.

> Bonne après midi.


Re: convertir une image jpeg en tiff

2017-04-05 Par sujet G2PC
Le 04/04/2017 à 18:24, JF Straeten a écrit :
> Re,
>
> On Tue, Apr 04, 2017 at 05:56:23PM +0200, G2PC wrote:
>
> [...]
>> tesseract image.tif sortie -l fra
>> Tesseract Open Source OCR Engine v3.04.01 with Leptonica
>> Error opening data file /usr/share/tesseract-ocr/tessdata/fra.traineddata
>> Please make sure the TESSDATA_PREFIX environment variable is set to the
>> parent directory of your "tessdata" directory.
>> Failed loading language 'fra'
>> Tesseract couldn't load any languages!
>> Could not initialize tesseract.
> faut installer tesseract-ocr-fra qui contient les fichiers de langue
> spécifiques au français...
>
> Ou alors procéder sans le '-l fra' ; parfois ça suffit...
> A+
Bonjour
Je ne suis pas convaincu que ajouter les fichiers de langue change quoi
que ce soit.
J'ai utilisé l'image de journal qui a un fond beige : image.jpg
Conversion en .tif : convert image.jpg image.tif

tesseract image.tif sortie -l fra
Le fichier de sortie est vide.

C'est donc le même résultat qu'avec la commande sans le pack de langue.
tesseract image.tif sortie

Plutôt qu'un problème de commande de l'OCR, c'est plutôt un problème
d'image, car, le fond beige de l'image ( découpée d'un " vieux " journal
) empêche la reconnaissance de caractères.
Il faudrait pouvoir éclaircir l'image, enlever le fond beige pour garder
un fond blanc, accentuer le texte en noir également.
Le problème semble plus être de l'ordre de la bonne utilisation de Gimp
que de tesseract.

Bonne après midi.



Re: convertir une image jpeg en tiff

2017-04-05 Par sujet JF Straeten

Re,

On Wed, Apr 05, 2017 at 04:42:00AM +0200, Haricophile wrote:

> On peut aussi utiliser en graphique gscan2pdf, ou un autre front-end
> à tesseract. Ça n'enlève rien au fait d'installer les fichiers de
> langues ad'hoc

Bien sûr.

Sauf que si g2p se vautre, c'est une autre histoire pour récupérer tes
scans... Pas impossible, certes, mais chiant à souhait (les fichiers
sont dans /tmp, mais nommés bizarrement, et vas-y pour les remettre en
ordre).

Depuis une funeste expérience vers la page 300, rien ne vaut un bon
scanimage qui crache les scans sur disque au fur et à mesure, et qui
restent acquis :-/

A+

-- 

JFS.



Re: convertir une image jpeg en tiff

2017-04-04 Par sujet Haricophile
Le Tue, 4 Apr 2017 18:24:22 +0200,
"JF Straeten"  a écrit :

> faut installer tesseract-ocr-fra qui contient les fichiers de langue
> spécifiques au français...
> 
> Ou alors procéder sans le '-l fra' ; parfois ça suffit...

On peut aussi utiliser en graphique gscan2pdf, ou un autre front-end à
tesseract. Ça n'enlève rien au fait d'installer les fichiers de langues
ad'hoc

-- 
haricoph...@aranha.fr 



Re: convertir une image jpeg en tiff

2017-04-04 Par sujet JF Straeten

Re,

On Tue, Apr 04, 2017 at 05:56:23PM +0200, G2PC wrote:

[...]
> tesseract image.tif sortie -l fra
> Tesseract Open Source OCR Engine v3.04.01 with Leptonica
> Error opening data file /usr/share/tesseract-ocr/tessdata/fra.traineddata
> Please make sure the TESSDATA_PREFIX environment variable is set to the
> parent directory of your "tessdata" directory.
> Failed loading language 'fra'
> Tesseract couldn't load any languages!
> Could not initialize tesseract.

faut installer tesseract-ocr-fra qui contient les fichiers de langue
spécifiques au français...

Ou alors procéder sans le '-l fra' ; parfois ça suffit...

A+

-- 

JFS.



Re: convertir une image jpeg en tiff

2017-04-04 Par sujet G2PC


Le 04/04/2017 à 17:32, JF Straeten a écrit :
> tesseract  sortie -l fra
image.jpg au depart. (Article de journal, sur fond beige.)
convert image.jpg image.tif

tesseract image.tif sortie -l fra
Tesseract Open Source OCR Engine v3.04.01 with Leptonica
Error opening data file /usr/share/tesseract-ocr/tessdata/fra.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the
parent directory of your "tessdata" directory.
Failed loading language 'fra'
Tesseract couldn't load any languages!
Could not initialize tesseract.



Re: convertir une image jpeg en tiff

2017-04-04 Par sujet JF Straeten

Re,


On Tue, Apr 04, 2017 at 05:07:47PM +0200, bernard.schoenac...@free.fr wrote:

[...]
> merci pour l'info et maintenant il s'agit de passer par tesseract
> pour obtenir le texte ...

tesseract  sortie -l fra

va ocriser le fichier  et cracher le texte dans 'sortie.txt'

Tu devrais aussi regarder alors du côté de 'jpegtopnm' ; c'est
peut-être une piste supplémentaire pour passer à tesseract.

Essaie peut-être aussi d'enlever la couleur du jpeg s'il est en
couleurs...

Hih,


-- 

JFS.



Re: convertir une image jpeg en tiff

2017-04-04 Par sujet G2PC
Le 04/04/2017 à 17:07, bernard.schoenac...@free.fr a écrit :
>
> - Mail original -
> De: "JF Straeten" <jfstrae...@scarlet.be>
> À: debian-user-french@lists.debian.org
> Envoyé: Mardi 4 Avril 2017 17:05:49
> Objet: Re: convertir une image jpeg en tiff
>
>
> Hello,
>
> On Tue, Apr 04, 2017 at 05:01:45PM +0200, bernard.schoenac...@free.fr wrote:
>
>> cf sujet et comment faire avec imagemagick
> Basiquement :
>
> convert image.jpeg image.tiff
>
>
> Mais il faudra peut-être ajuster l'algo de compression avec -compress 'XXX'
> convert image.jpeg -compress 'XXX' image.tiff
> suivant ce que tu veux dans le tiff...
> Hih,
convert image.jpg image.tif
tesseract image.tif text

Le soucis pour ton image de journal, elle est beige sur le fond. Il faut
surement la retravailler avec gimp.



Re: convertir une image jpeg en tiff

2017-04-04 Par sujet Dominique Asselineau
bernard.schoenac...@free.fr wrote on Tue, Apr 04, 2017 at 05:01:45PM +0200
> bonjour,
> 
> cf sujet et comment faire avec imagemagick

$ convert UneImege.jpg LaMeme.tiff

Convert du paquet imagemagick

--



Re: convertir une image jpeg en tiff

2017-04-04 Par sujet bernard . schoenacker


- Mail original -
De: "JF Straeten" <jfstrae...@scarlet.be>
À: debian-user-french@lists.debian.org
Envoyé: Mardi 4 Avril 2017 17:05:49
Objet: Re: convertir une image jpeg en tiff


Hello,

On Tue, Apr 04, 2017 at 05:01:45PM +0200, bernard.schoenac...@free.fr wrote:

> cf sujet et comment faire avec imagemagick

Basiquement :

convert image.jpeg image.tiff


Mais il faudra peut-être ajuster l'algo de compression avec -compress 'XXX'

convert image.jpeg -compress 'XXX' image.tiff

suivant ce que tu veux dans le tiff...

Hih,

-- 

JFS.

bonjour,

merci pour l'info et maintenant il s'agit de passer par tesseract 
pour obtenir le texte ...

slt
bernard



Re: convertir une image jpeg en tiff

2017-04-04 Par sujet JF Straeten

Hello,

On Tue, Apr 04, 2017 at 05:01:45PM +0200, bernard.schoenac...@free.fr wrote:

> cf sujet et comment faire avec imagemagick

Basiquement :

convert image.jpeg image.tiff


Mais il faudra peut-être ajuster l'algo de compression avec -compress 'XXX'

convert image.jpeg -compress 'XXX' image.tiff

suivant ce que tu veux dans le tiff...

Hih,

-- 

JFS.



convertir une image jpeg en tiff

2017-04-04 Par sujet bernard . schoenacker
bonjour,

cf sujet et comment faire avec imagemagick

merci

slt
bernard