Christian Schmidt schrieb:

Keine Angst: Das ist nur ein Konfigurationsfehler. Auf unserem
Webserver an der Uni konnten wir diesen beheben, indem wir xpdf
installierten und htdig anwiesen, PDF-Dateien damit zu parsen.

Hallo Christian,


also schlicht einen anderen Parser genommen?

Bei meinem privaten Archiv hatte ich auch schon mit den beiden Parsern experimentiert und festgestellt, da� der eine von beiden mehr (einen prozentual h�heren Anteil) von PDF-Dokumenten erkennt, w�hrend der andere den Text auf "zusammenh�ngendere" Art und Weise herauszieht.

PDF scheint doch sehr komplex und vielf�ltig zu sein. Das merkt man ja schon, wenn man mit einem alten AcrobatReader an ein neues Dokument geht: was einem da an Color Spaces und anderen Sachen als Fehler um die Ohren gehauen wird!


Erst mal vielen Dank! Eberhard


--
Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/


Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Antwort per Email an