Re: Universaler Textkonverter?

2004-08-25 Diskussionsfäden Andreas Pakulat
On 25.Aug 2004 - 00:45:05, Peter Holm wrote:
> On Tue, 24 Aug 2004 22:10:15 +0200, Andreas Pakulat <[EMAIL PROTECTED]>
> wrote:
> ja, die kenn ich, ich suche nach einem Alleskönner.

Das ist aber nicht die Idee bei GNU/Linux, denn wir wollen moeglichst
kleine feine Tools die genau 1 Aufgabe sehr gut erledigen und die
ausserdem kombinierbar sind. Und ein wrapper um die verschiedenen
Konverter zu basteln sollte kein so grosses Problem sein.

> Ich bin einfach nur einigermassen entsetzt darüber, dass es trotz der
> geballten Intelligenz, die heutzutage in den Unis und sonstigen
> IT-Zentralen herumsitzt, immer noch so ein Chaos in Sachen Text und
> Formatierung existiert. Docbook, Openoffice, Abiword, proprietäre
> Formate, Wiki Markup, Xhtml, teX, pdf... und alle zueinander nur
> begrenzt kompatibel. Grausam. Wirklich peinlich für die ganze IT
> Branche. 

Es braucht einfach keiner, wenn ich ein Word-Dokument kriege oeffne
ich das mit OOo und bearbeite es, drucke es aus oder konvertiere es
eventuell noch in ein pdf. Wenn ich den Text in eine ascii-Datei haben
will mache ich dass dann mittels Copy&Paste. Bei HTML ist das
natuerlich nicht ganz so einfach, aber es ist ja auch kein problem
mal fix html2txt einzutippen.

> Mir ist klar, dass genau deshalb XML existiert. Aber das gibt es nun
> schon eine ganze Weile, und wo ist er jetzt, der universale
> Textkonverter? Müsste doch eigentlich schon fertig sein.

Also OOo's Format ist XML und docbook kann man doch auch in XML
umwandeln (oder irre ich mich da grad?), damit hast du doch alles was
du brauchst oder? Was du nun vielleicht noch brauchst ist ein xml2xml
converter der die eine in die andere DTD/XML-Schema uebersetzt.

> Es ist doch eine ungeheure Verschwendung von Energie und Potential,
> dass sich jeder einzelne User erneut durch dieses Chaos von
> Textformaten und deren Konvertierung prügeln muss, und letztlich keine
> wirklich befriedigende Lösung zu finden ist... wie sinnvoll könnten
> die Menschen Ihre zeit nutzen...

?? Das verstehe ich nciht so ganz, die wenigsten User wollen aus einem
*doc den Text rausholen und kriegen es nciht per Copy&Paste hin.
docbook wird ja wohl von Doku-Schreibern benutzt und die kennen die
noetigen Tools wohl auch. Was pdf angeht: Das will man i.A. nur
ausdrucken oder am Bildschirm betrachten, und fuer Textpassagen gibts
wiederum Copy&Paste.

> Also, Informatikstudenten dieser Welt, es gibt wirklich noch Lorbeeren
> zu ernten!!!

Nicht wirklich, die Tools existieren soweit schon, alles was man
braucht ist ein Wrapper der allgemeine Optionen "uebersetzt" fuer das
jeweilige Tool.

> Musste jetzt nur mal etwas herumstänkern. Hatte gerade wieder was mit
> Textformaten zu tun und stosse immer wieder darauf, wie grausam
> primitiv die Computertechnik heutzutage noch ist in sehr fundamentalen
> Bereichen... man kann nur hoffen, dass Open Source die Entwicklung
> beschleunigen wird...

Beschreib doch mal das Problem.

Andreas

-- 
I've run DOOM more in the last few days than I have the last few
months.  I just love debugging ;-)
(Linus Torvalds)


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Universaler Textkonverter?

2004-08-24 Diskussionsfäden Rudi Effe
Am Dienstag 24 August 2004 19:44 schrieb Peter Holm:
> Hi,
>
> gibt es einen universalen Textkonverter? Für "alle" Formate? Zumindest
> die wichtigsten, inkl. swx, pdf, html, xhtml, docbook, doc, etc. ???

Hi, 

vielleicht kannst du openoffice, das die meisten formate kann, per command 
line dazu bewegen, statt zu starten, eine konversion durchzuführen?

--> man oowriter

außerdem konnte ich die folgenden tools per apt-cache search finden -- 
ansonsten such mal mit google nach "doc2sxw" oder "rtftohtml" usw.

catdoc - MS-Word to TeX or plain text converter
linuxdoc-tools - SGML converters for the LinuxDoc DTD only.
sgmltools-lite - convert DocBook SGML source into HTML using DSSSL
trang - Multi-format XML schema converter based on RELAX NG
txt2html - Text to HTML converter
wpd2sxw - WordPerfect to OpenOffice.org converter
tth - TeX/LaTeX to HTML converter
xmlto - XML-to-any converter
wp2x - WordPerfect 5.x to whatever converter
axkit-language-htmldoc - AxKit module for converting XHTML into PDF using 
HTMLDOC
debiandoc2dbxml - DebianDoc to DocBook XML converter
unrtf - RTF to other formats converter
a2ps - GNU a2ps - 'Anything to PostScript' converter and pretty-printer

Mit google findest du sicher noch mehr...

Gruß
rUdi



Re: Universaler Textkonverter?

2004-08-24 Diskussionsfäden Peter Holm
On Tue, 24 Aug 2004 22:10:15 +0200, Andreas Pakulat <[EMAIL PROTECTED]>
wrote:

>Hmm, also weder pdf noch doc oder swx sind Texte, sie enthalten Text.

Stimmt! 100% korrekt! 

>Willst du diesen extrahieren? Dafuer gibts AFAIK Tools, frag doch
>Google mal nach pdf2txt oder doc2txt

ja, die kenn ich, ich suche nach einem Alleskönner.

>Mit apt-cache search docbook findest du bestimmt was zu docbook und
>auch um daraus html oder pdf oder sonstwas zu erzeugen.

Ja klar findet man auch für docbook was, aber eben nur für docbook.

>Du solltest auch daran denken dass manche der Konvertierungen
>verlustbehaftet sind, d.h. du verlierst eventuell Schriften oder
>Formatierungen.

Ja, das ist auch ein ganz, ganz grosses Problem.

Ich hab mich vielleicht nicht korrekt ausgedrückt, bzw. hätte
UNIVERSAL betonen sollen. 

Ich bin einfach nur einigermassen entsetzt darüber, dass es trotz der
geballten Intelligenz, die heutzutage in den Unis und sonstigen
IT-Zentralen herumsitzt, immer noch so ein Chaos in Sachen Text und
Formatierung existiert. Docbook, Openoffice, Abiword, proprietäre
Formate, Wiki Markup, Xhtml, teX, pdf... und alle zueinander nur
begrenzt kompatibel. Grausam. Wirklich peinlich für die ganze IT
Branche. 

Mir ist klar, dass genau deshalb XML existiert. Aber das gibt es nun
schon eine ganze Weile, und wo ist er jetzt, der universale
Textkonverter? Müsste doch eigentlich schon fertig sein.

Es ist doch eine ungeheure Verschwendung von Energie und Potential,
dass sich jeder einzelne User erneut durch dieses Chaos von
Textformaten und deren Konvertierung prügeln muss, und letztlich keine
wirklich befriedigende Lösung zu finden ist... wie sinnvoll könnten
die Menschen Ihre zeit nutzen...

Also, Informatikstudenten dieser Welt, es gibt wirklich noch Lorbeeren
zu ernten!!!

Musste jetzt nur mal etwas herumstänkern. Hatte gerade wieder was mit
Textformaten zu tun und stosse immer wieder darauf, wie grausam
primitiv die Computertechnik heutzutage noch ist in sehr fundamentalen
Bereichen... man kann nur hoffen, dass Open Source die Entwicklung
beschleunigen wird...


Dennoch: sollte es den universalen Text-FORMAT-Konverter doch geben
und ich hab ihn bisher verpasst, bitte nochmal melden. 

Wenn das ansonsten ein gelangweiltes Programmiergenie lesen sollte,
das gerade nicht weiss, was es tun soll, bitte mach schon mal ein
Projekt bei sf.net auf... ;)



Peter


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: Universaler Textkonverter?

2004-08-24 Diskussionsfäden Andreas Pakulat
On 24.Aug 2004 - 19:44:02, Peter Holm wrote:
> Hi,
> 
> gibt es einen universalen Textkonverter? Für "alle" Formate? Zumindest
> die wichtigsten, inkl. swx, pdf, html, xhtml, docbook, doc, etc. ???
> 
> ür die Kommandozeile? Oder als Library? Oder beides?

Hmm, also weder pdf noch doc oder swx sind Texte, sie enthalten Text.
Willst du diesen extrahieren? Dafuer gibts AFAIK Tools, frag doch
Google mal nach pdf2txt oder doc2txt

Mit apt-cache search docbook findest du bestimmt was zu docbook und
auch um daraus html oder pdf oder sonstwas zu erzeugen.

Du solltest auch daran denken dass manche der Konvertierungen
verlustbehaftet sind, d.h. du verlierst eventuell Schriften oder
Formatierungen.

Andreas

-- 
What no spouse of a writer can ever understand is that a writer is working
when he's staring out the window.


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Universaler Textkonverter?

2004-08-24 Diskussionsfäden Peter Holm
Hi,

gibt es einen universalen Textkonverter? Für "alle" Formate? Zumindest
die wichtigsten, inkl. swx, pdf, html, xhtml, docbook, doc, etc. ???

ür die Kommandozeile? Oder als Library? Oder beides?

Danke!

Peter


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)