Hallo Michael,
hachja, so sind sie halt, die vom einen einzigen wahren
Glauben(nämlich Java) abgefallen sind und jetzt dem anderen einzigen
wahren Glauben anhängen (nämlich ruby) :) - ich kenn das, mir geht das
auch so, dass ich um alle Worte, die mit J anfangen einen Bogen
mache.... Aber ein bisschen nüchterner betrachtet, ist ferret nur ein
müder (dazu instabiler...) Abklatsch von lucene ist, und PDF:Writer
funktional in den kleinen Finger von itext reinpasst.... Na, aber am
Ende braucht man vielleicht das ja auch wirklich nicht alles, sondern
kommt mit einer Lösung aus sphinx/ultrasphinx (mit ultrasphinx kommt
man direkter an die sphinx-api ran - ob das mit thinking-sphinx auch
geht, weiß ich nicht) und pdf::writer zum Extrahieren aus? Und dann
noch irgendein messaging/cron-job, um das indexieren irgendwie
auszulagern? Sollte man also auch irgendwie java-frei hinkriegen,
braucht aber mehr Handarbeit...
Grüße
Stefan
Am 11.11.2008 um 12:53 schrieb Michael Kastner:
Hallo Frank,
vielen Dank für die Infos. Ich bin gerade dabei, meine letzten Java-
Apps von den Servern zu werfen und dann auch den Tomcat. Java ist
eigentlich keine Option im Moment. Hätte ich vielleicht gleich
dazuschreiben sollen.
Ich schau mich mal weiter um.
Vielen Dank und viele Grüße
Michael Kastner
Stefan Frank schrieb:
lucene+pdfbox oder itext, wenn's auch jruby sein darf. Oder solr,
wenn's ein eigener Server für's Suchen sein darf. Solr hat
REST&JSON-Interfaces, ist also nicht so schwer in rails einzubinden.
Grüße
Stefan
Am 11.11.2008 um 10:42 schrieb Michael Kastner:
Hallo,
kennt jemand serverseitige OS-Lösungen, mit denen man PDFs
indizieren und durchsuchen kann?
Viele Grüße
Michael Kastner
_______________________________________________
rubyonrails-ug mailing list
[email protected]
http://mailman.headflash.com/mailman/listinfo/rubyonrails-ug
----
stefan frank
vierundsechzig.de
software&service
weberstr. 10
69120 heidelberg
tel. +49 (0) 6221 7277049
mobil +40 (0) 173 2383390
mail [EMAIL PROTECTED]
www.vierundsechzig.de
_______________________________________________
rubyonrails-ug mailing list
[email protected]
http://mailman.headflash.com/mailman/listinfo/rubyonrails-ug
_______________________________________________
rubyonrails-ug mailing list
[email protected]
http://mailman.headflash.com/mailman/listinfo/rubyonrails-ug
----
stefan frank
vierundsechzig.de
software&service
weberstr. 10
69120 heidelberg
tel. +49 (0) 6221 7277049
mobil +40 (0) 173 2383390
mail [EMAIL PROTECTED]
www.vierundsechzig.de
_______________________________________________
rubyonrails-ug mailing list
[email protected]
http://mailman.headflash.com/mailman/listinfo/rubyonrails-ug