dig-Lauf_scheitert_a?==?ISO-8859-1?Q?n_2_PDF-Dateien?=

Eberhard Spittler Wed, 23 Jul 2003 22:25:41 -0700

Christian Schmidt schrieb:

Keine Angst: Das ist nur ein Konfigurationsfehler. Auf unserem
Webserver an der Uni konnten wir diesen beheben, indem wir xpdf
installierten und htdig anwiesen, PDF-Dateien damit zu parsen.

Hallo Christian,

also schlicht einen anderen Parser genommen?

Bei meinem privaten Archiv hatte ich auch schon mit den beiden Parsern experimentiert und festgestellt, daï¿½ der eine von beiden mehr (einen prozentual hï¿½heren Anteil) von PDF-Dokumenten erkennt, wï¿½hrend der andere den Text auf "zusammenhï¿½ngendere" Art und Weise herauszieht.

PDF scheint doch sehr komplex und vielfï¿½ltig zu sein. Das merkt man ja schon, wenn man mit einem alten AcrobatReader an ein neues Dokument geht: was einem da an Color Spaces und anderen Sachen als Fehler um die Ohren gehauen wird!


Erst mal vielen Dank!
Eberhard

-- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)

Re: =?ISO-8859-1?Q?t=E4glicher_ht=3A//dig-Lauf_scheitert_a?==?ISO-8859-1?Q?n_2_PDF-Dateien?=

Antwort per Email an