Re: [OT] XML entzippen
Michelle Konzack wrote: Am 2004-06-14 22:57:30, schrieb Rainer Bendig, Digitally Impressed: Markus Raab schrieb am 14.06.2004 20:43: Es handelt sich nur um ein Skript welches den xml Markup entfernt, der Text bleibt übrig: $ apt-get install xml2 sollte das übrige tun ... habs allerdings nicht getestet xml2 - Convert between XML, HTML, CSV and a line-oriented format Habe es gerade ausprobiert, aber entfernt nit die xml-Tags... Der output ist auf alle fälle unlesbar. Du musst natürlich bei der richtigen Datei den Markup entfernen, das Archiv enthält auch andere Teile und ist komprimiert. mfg Markus -- Linux, the choice | Diplomatie ist die Kunst, so gut zu lügen, of a GNU generation -o) | daß einem sogar die Wahrheit geglaubt wird. Kernel 2.6.6 /\ | Alberto Sordi on a i686 _\_v | -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)
Re: [OT] XML entzippen
Am 2004-06-15 22:27:47, schrieb Markus Raab: Du musst natürlich bei der richtigen Datei den Markup entfernen, das Archiv enthält auch andere Teile und ist komprimiert. Für sowas sollte man aus dem sxw Archiv die contents.xml verwenden :-) Für so dumm braucht mich keiner halten... Aber das 'xml2' entfernt keine markup... Es verwandelt die Datei sauber in ZEILEN ! Ein Markup pro zeile mfg Markus Greetings Michelle -- Linux-User #280138 with the Linux Counter, http://counter.li.org/ Michelle Konzack Apt. 917 ICQ #328449886 50, rue de Soultz MSM LinuxMichi 0033/3/8845235667100 Strasbourg/France IRC #Debian (irc.icq.com) signature.pgp Description: Digital signature
Re: [OT] XML entzippen
Michelle Konzack wrote: Am 2004-06-13 15:56:37, schrieb Markus Raab: Es gibt sxw2txt damit du Openofficedokumente auch ohne Openoffice lesen kannst. Und wo ist das ? Ich finde es weder unter WOODY noch SARGE oder SID. Dürfte dort nicht dabei sein. Es handelt sich nur um ein Skript welches den xml Markup entfernt, der Text bleibt übrig: Vielleicht heist es auch oo2txt, ich konnte es nicht mehr finden, darum ist es im Anhang[0] mfg Markus [0] #!/bin/bash ver=0.4 if [[ $1 = || $2 = ]] then echo -e OpenOffice.org Converter by Dicky 'Mas Saint' Wahyu Purnomo ver $ver Syntax : oo2txt [filename.sxw/filename.sxc] [text/html] Requirement : GNU sed version 3.0x or above Lynx UnZip Tips : oo2txt filename.sxw text filename.txt Contact Me : Dicky Wahyu Purnomo 'Mas Saint' Email : [EMAIL PROTECTED] Web : http://massaint.or.id YahooID : dicky_wp ICQ # : 5561766 else file=$1 tmpfile=/tmp/OO2TXT`date +%d%m%Y%H%M` unzip -qq -o -C $1 content.xml -d /tmp/ mv /tmp/content.xml $tmpfile echo html head style !-- p {font-family:verdana,lucida;font-size:11px} td {font-family:verdana,lucida} .P1 {font-family:verdana,lucida;font-weight:bold;font-size:14px} .P11 {font-family:verdana,lucida;font-weight:bold} .P12 {font-family:verdana,lucida;font-weight:bold} .P19 {font-family:verdana,lucida;font-weight:bold} .P22 {font-family:verdana,lucida;font-weight:bold;font-size:12px} .P23 {font-family:verdana,lucida;font-weight:bold;font-size:12px} -- /style /head $tmpfile.html cat $tmpfile | tr \n | sed s/$/''/g | grep -v '?xml version=1.0 encoding=UTF-8?' | grep -v ^$ | egrep -v text:table-of-content|text:index-title-template|text:index-entry- style:font-decl|style:style|style:properties|style:tab style:background|style:column|text:list-style text:list-level-style-number|text:list-level-style-bullet text:sequence-decl|number:number|office:script|office:font-decls office:automatic-styles|table:table-column|table:table-header-rows | sed s/'text:style-name='/'class='/g | sed s/'text:p'/'p'/g | sed s/'office:body'/'body'/g | sed s/'office:document-content'/'html'/g | sed s/'table:table '/'table border=1 cellspacing=0 cellpadding=2 style=border-style:solid;color:black'/g | sed s/'table:table-row'/'tr' g | sed s/'table:table-cell'/'td'/g | sed s/'table:table'/'table'/g | sed s/'text:unordered-list'/'ul'/g | sed s/'text:ordered-list'/'ol'/g | sed s/'text:list-item'/'li'/g | grep -v ^[1-9]/p$ | grep -v ^[1-9 [0-9]/p$ | sed s/^\/td$/\nbsp;\/td/g $tmpfile.html if [[ $2 == text ]] then lynx -dump $tmpfile.html fi if [[ $2 == html ]] then cat $tmpfile.html fi rm -f $tmpfile fi -- Linux, the choice | Abhängigkeit ist heiser, wagt nicht, laut of a GNU generation -o) | zu reden. -- Shakespeare, Rome und Julia Kernel 2.6.6 /\ | on a i686 _\_v | -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)
Re: [OT] XML entzippen
Hallo Markus, Am 2004-06-14 20:43:09, schrieb Markus Raab: Vielleicht heist es auch oo2txt, ich konnte es nicht mehr finden, darum ist es im Anhang[0] Das war wohl nichts... Das Script ist als quoted-printable angekommen und hat es ist zerlegt angekommen. Kannst Du es noch mal als gzip senden bitte ? Schönen Abend Michelle -- Linux-User #280138 with the Linux Counter, http://counter.li.org/ Michelle Konzack Apt. 917 ICQ #328449886 50, rue de Soultz MSM LinuxMichi 0033/3/8845235667100 Strasbourg/France IRC #Debian (irc.icq.com) signature.pgp Description: Digital signature
Re: [OT] XML entzippen
Am 2004-06-14 22:57:30, schrieb Rainer Bendig, Digitally Impressed: Markus Raab schrieb am 14.06.2004 20:43: Es handelt sich nur um ein Skript welches den xml Markup entfernt, der Text bleibt übrig: $ apt-get install xml2 sollte das übrige tun ... habs allerdings nicht getestet xml2 - Convert between XML, HTML, CSV and a line-oriented format Habe es gerade ausprobiert, aber entfernt nit die xml-Tags... Der output ist auf alle fälle unlesbar. (Und ich brauch nen anständigen reader ... grummel) :-) Greetings Michelle -- Linux-User #280138 with the Linux Counter, http://counter.li.org/ Michelle Konzack Apt. 917 ICQ #328449886 50, rue de Soultz MSM LinuxMichi 0033/3/8845235667100 Strasbourg/France IRC #Debian (irc.icq.com) signature.pgp Description: Digital signature
[OT] XML entzippen
ja hallo erstmal,... ich suche jetzt schon seit einiger Zeit nach einem netten Programm, dass komprimierte XML Dokumente (wie sie z.B. von OpenOffice oder k3b erzeugt werden) darstellt oder in lesbare XML-Dokumente umwandelt. (Nein, mozilla oder konqueror können es nicht). Any hints? Keep smiling yanosz
Re: [OT] XML entzippen
Hello Jan, On Sun, 13 Jun 2004 12:51:58 +0200 Jan Lühr [EMAIL PROTECTED] wrote: ja hallo erstmal,... ich suche jetzt schon seit einiger Zeit nach einem netten Programm, dass komprimierte XML Dokumente (wie sie z.B. von OpenOffice oder k3b erzeugt werden) darstellt oder in lesbare XML-Dokumente umwandelt. (Nein, mozilla oder konqueror können es nicht). Any hints? unzip Jörg -- Jörg Schütter http://www.lug-untermain.de/ [EMAIL PROTECTED] http://www.schuetter.org/joerg/ ICQ: 298982789 http://mypenguin.bei.t-online.de/
Re: [OT] XML entzippen
ja hallo erstmal,... Am Sonntag, 13. Juni 2004 12:58 schrieb Jörg Schütter: Hello Jan, On Sun, 13 Jun 2004 12:51:58 +0200 Jan Lühr [EMAIL PROTECTED] wrote: ja hallo erstmal,... ich suche jetzt schon seit einiger Zeit nach einem netten Programm, dass komprimierte XML Dokumente (wie sie z.B. von OpenOffice oder k3b erzeugt werden) darstellt oder in lesbare XML-Dokumente umwandelt. (Nein, mozilla oder konqueror können es nicht). Any hints? unzip ARGS. Und ich verzuche zcat, zless, gunzip... Keep smiling yanosz
Re: [OT] XML entzippen
Hi, unzip ARGS. Und ich verzuche zcat, zless, gunzip... Hättest du auch einfach in eine .zip umbenannt. Hätte auch das gewünschte Ergebnis gebracht. Keep smiling Greetz yanosz Pierre signature.asc Description: Dies ist ein digital signierter Nachrichtenteil
Re: [OT] XML entzippen
Jan Lühr wrote: ja hallo erstmal,... ich suche jetzt schon seit einiger Zeit nach einem netten Programm, dass komprimierte XML Dokumente (wie sie z.B. von OpenOffice oder k3b erzeugt werden) darstellt oder in lesbare XML-Dokumente umwandelt. (Nein, mozilla oder konqueror können es nicht). Any hints? Es gibt sxw2txt damit du Openofficedokumente auch ohne Openoffice lesen kannst. xml ist außerdem lesbar... mfg Markus -- Linux, the choice | Die Zeit ist der beste Lehrer. Leider tötet of a GNU generation -o) | sie ihre Schüler. -- Sprichwort Kernel 2.6.6 /\ | on a i686 _\_v | -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)
Re: [OT] XML entzippen
Am 2004-06-13 15:56:37, schrieb Markus Raab: Es gibt sxw2txt damit du Openofficedokumente auch ohne Openoffice lesen kannst. Und wo ist das ? Ich finde es weder unter WOODY noch SARGE oder SID. ( 'apt-cache source sxw2txt' ) __ / | Reading Package Lists... | Building Dependency Tree... | E: Unable to find a source package for sxw2txt \__ Ich habe übringends alle Packages.gz und Sources.gz von bo bis sid xml ist außerdem lesbar... mfg Markus Greetings Michelle -- Linux-User #280138 with the Linux Counter, http://counter.li.org/ Michelle Konzack Apt. 917 ICQ #328449886 50, rue de Soultz MSM LinuxMichi 0033/3/8845235667100 Strasbourg/France IRC #Debian (irc.icq.com) signature.pgp Description: Digital signature