Hi, nachdem ich mit Sane und einen kleinen selbstgebastelten daemon meinen scanner am laufen habe d.h. auf knopdruck das gesamte dokument mit scanadf durchgezogen und in ein PDF gewandelt wird habe ich nun das problem das ich gerne leere seiten eliminieren wuerde. Der scanner kann duplex scannen und je nach function macht der das auch - nur ist oftmals der letzte ruecken oder so leer und den wuerde ich gerne im resultierenden pdf eliminieren. Derzeitiger workflow:
Nach dem erfolgreichen scan wird dieses script aufgerufen was dann
die scans erst mit unpaper nen bischen aufraeumt und dann mit tiff2cp und
tiff2pdf
in ein pdf wandelt:
TMPDIR=$1
unpaper=/usr/bin/unpaper
pnmtotiff=/usr/bin/pnmtotiff
tiffcp=/usr/bin/tiffcp
tiff2pdf=/usr/bin/tiff2pdf
set -x
OUTPUT=~/Desktop/scan-`date +%Y%m%d%H%M%S`.pdf
${unpaper} -v --layout none ${TMPDIR}/scan-%d.pnm
${TMPDIR}/unpaper-%d.pnm
for file in ${TMPDIR}/unpaper*; do
${pnmtotiff} $file >$file.tiff
done
${tiffcp} ${TMPDIR}/*.tiff ${TMPDIR}/allpages.tiff
${tiff2pdf} -z -o ${OUTPUT} ${TMPDIR}/allpages.tiff
Der naechste schritt waere noch via tesseract ein OCR und das
als comment ans PDF haengen - aber das beim naechsten mal.
Jetzt erstmal - Wie werde ich "leere" seiten los?
Flo
--
Florian Lohoff [email protected] +49-171-2280134
Those who would give up a little freedom to get a little
security shall soon have neither - Benjamin Franklin
signature.asc
Description: Digital signature
-- Linux mailing list [email protected] subscribe/unsubscribe: http://lug-owl.de/mailman/listinfo/linux Hinweise zur Nutzung: http://www.lug-owl.de/Mailingliste/hints.epo
