>
> Maybe a bit out of topic but I manage to obtain incredible result with the 
> couple ScanTailor / Imagemagick.
>
   Here  is the simple code :

#!/usr/bin/sh
# you need to have Scantailor and mogrify (from Imagmagic) in the path
set -x

. tess.ini
< import these
IMG_DIR=/opt/T
IMG_DIR_ST=/opt/T/st
IMG_DIR_ST_OUT=/opt/T/st/out
ST=/cygdrive/c/app/ocr/ScanTailor/scantailor-cli.exe
convert alias to /cygdrive/c/app/ocr/ImageMagick/convert.exe
>

while [ -n "$1" ]
>   do
>     case $1 in
>       -b1 ) black=2 ; white=2 ;;
>       -b ) black=$2 ; shift ;;
>       -w ) white=$2 ; shift ;;
>     esac
>     shift
>   done
> if [ ! -d $IMG_DIR_ST_OUT ] ;then
>     mkdir  $IMG_DIR_ST_OUT
> fi
> black=${black:-0}
> white=${white:-0}
>  cd  $IMG_DIR_ST
>  LST=`find . -maxdepth 1 -type f`
>        $ST  -v      \
>            --layout=1.5 \
>            --dpi=300  \
>            --output-dpi=300  \
>            --margins-top=5  --margins-bottom=5  --margins-left=10 
>  --margins-right=10  \
>            --threshold=13  \
>            --picture-shape=rectangular \
>            --enable-page-detection \
>            --white-margins \
>            --enable-fine-tuning \
>            --normalize-illumination=true  \
>            --color-mode=color_grayscale \
>            --despeckle=off  --start-filter=3  $LST  $CYG_IMG_DIR_ST_OUT
>            #--color-mode=color_grayscale \
> cd $IMG_DIR_ST_OUT
> for f in `ls`
> do
>   if [ -f  $f ];then
>        #$RAD=`echo $f | sed 's/.tif//'`
>        if [ $black -gt 0 -o $white -gt 0 ];then
>            convert $f  -type GrayScale  -contrast-stretch 
> ${black}%x${white}%   $f
>        else
>            convert $f  -type GrayScale  -normalize   $f
>        fi
>        # set to A4
>        #mogrify -resize 2130x3767 $f
>   fi
> done


source Image: 

<https://lh4.googleusercontent.com/-wWuRDplFSbs/UxMUkpre-SI/AAAAAAAAABY/Hq2uHkmJZZo/s1600/b0.jpg>


standard result of the script:

<https://lh5.googleusercontent.com/-rywDJJ8bZKU/UxMUvDpRF6I/AAAAAAAAABg/3OuLz-4RRfg/s1600/b1.jpg>

 
Darkened result (when using option -b1) :

<https://lh4.googleusercontent.com/-KlMStJD3XXg/UxMU1ogC4yI/AAAAAAAAABo/hEVOa3TgkhI/s1600/b2.jpg>
The resulting scan (tesseract 3.03 on cygwin  is:


ses caractères généraux, le mouton etbaï se rapproche étroite-
> ment de l'espèce a large queue; mais il s’en distingue par une
> queue mince, longue et toull‘ue, et par quelques détails (le la
> robe. Celle—ci, qui n’est pas laineuse, se compose simplement
> d'un poil long, droit et ternie; elle est presque toujours entie—
> reinent blanche, excepté, et c'est lz‘i le [n‘incipal caractère de la
> race, excepté. aux chevilles et a la bouche, qui sont revêtues de
> noir.
> Dans le pays, le prix courant de ces montons ne dépasse ja-
> mais un dollar; un jeune agneau n’a que la moitié «le cette va—
> leur.
> (in ne rencontre de vaches que dans les environs (le, Souakin
>
>
> Mouton des Bicharines.
> et sur la route- du Taka, plus méridionale que la nôtre. Sur la
> ligne que nous suivions, la pluie est moins abondante, et les
> bétes bovines n’auraient pas toute l’année, comme dans les patu—
> rages de la Barka, la nourriture nécessaire a leur entretien.
> Sortis de l’Ameht, nous traversâmes, dans le district suivant,
> un plateau élevé que déchiraient de nombreux vallons, se diri-
> geant au sud-ouest, et creusés profondément au milieu (les
> pierres et de la rocaille. Le plus important de ces larges ravins,
> aux cours d’eau périodiques, est l’ouadi Arab; son lit desséché
> nous opposa des berges de trente à quarante pieds de hauteur,
> dont les pentes abruptes soumirent nos chameaux a une rude
> épreuve.



I am still working on getting a blank page but up to now I could not manage 
it without altering too much the images.
On the translation side, still working on tweak the FRA langage.

-- 
-- 
You received this message because you are subscribed to the Google
Groups "tesseract-ocr" group.
To post to this group, send email to [email protected]
To unsubscribe from this group, send email to
[email protected]
For more options, visit this group at
http://groups.google.com/group/tesseract-ocr?hl=en

--- 
You received this message because you are subscribed to the Google Groups 
"tesseract-ocr" group.
To unsubscribe from this group and stop receiving emails from it, send an email 
to [email protected].
For more options, visit https://groups.google.com/groups/opt_out.

Reply via email to