Re: [OT] XML entzippen

2004-06-15 Diskussionsfäden Markus Raab
Michelle Konzack wrote:

 Am 2004-06-14 22:57:30, schrieb Rainer Bendig, Digitally Impressed:
Markus Raab schrieb am 14.06.2004 20:43:
Es handelt sich nur um ein Skript welches den xml Markup entfernt,
der Text bleibt übrig:
$ apt-get install xml2
sollte das übrige tun ...

habs allerdings nicht getestet 
xml2 - Convert between XML, HTML, CSV and a line-oriented format
 
 Habe es gerade ausprobiert, aber entfernt nit die xml-Tags...
 Der output ist auf alle fälle unlesbar.

Du musst natürlich bei der richtigen Datei den Markup entfernen, das
Archiv enthält auch andere Teile und ist komprimiert.

mfg Markus 

-- 
Linux, the choice  | Diplomatie ist die Kunst, so gut zu lügen, 
of a GNU generation   -o)  | daß einem sogar die Wahrheit geglaubt wird.
Kernel 2.6.6   /\  | Alberto Sordi   
on a i686 _\_v | 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: [OT] XML entzippen

2004-06-15 Diskussionsfäden Michelle Konzack
Am 2004-06-15 22:27:47, schrieb Markus Raab:

Du musst natürlich bei der richtigen Datei den Markup entfernen, das
Archiv enthält auch andere Teile und ist komprimiert.

Für sowas sollte man aus dem sxw Archiv die contents.xml verwenden :-)
Für so dumm braucht mich keiner halten...

Aber das 'xml2' entfernt keine markup...
Es verwandelt die Datei sauber in ZEILEN !

Ein Markup pro zeile

mfg Markus 

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: [OT] XML entzippen

2004-06-14 Diskussionsfäden Markus Raab
Michelle Konzack wrote:

 Am 2004-06-13 15:56:37, schrieb Markus Raab:
 
Es gibt sxw2txt damit du Openofficedokumente auch ohne Openoffice
lesen kannst.
 
 Und wo ist das ?
 Ich finde es weder unter WOODY noch SARGE oder SID.

Dürfte dort nicht dabei sein.

Es handelt sich nur um ein Skript welches den xml Markup entfernt, der
Text bleibt übrig:

Vielleicht heist es auch oo2txt, ich konnte es nicht mehr finden, darum
ist es im Anhang[0]

mfg Markus

[0]
#!/bin/bash

ver=0.4
if [[ $1 =  || $2 =  ]]
then
echo -e 

OpenOffice.org Converter by Dicky 'Mas Saint' Wahyu Purnomo ver
$ver


Syntax :
oo2txt [filename.sxw/filename.sxc] [text/html]

Requirement :
GNU sed version 3.0x or above  
Lynx
UnZip   

Tips :
oo2txt filename.sxw text  filename.txt

Contact Me :
Dicky Wahyu Purnomo 'Mas Saint'
Email   : [EMAIL PROTECTED]
Web : http://massaint.or.id
YahooID : dicky_wp
ICQ #   : 5561766


else

file=$1
tmpfile=/tmp/OO2TXT`date +%d%m%Y%H%M`

unzip -qq -o -C $1 content.xml -d /tmp/
mv /tmp/content.xml $tmpfile

echo html
head
style
!--
p {font-family:verdana,lucida;font-size:11px}
td {font-family:verdana,lucida}
.P1 {font-family:verdana,lucida;font-weight:bold;font-size:14px}
.P11 {font-family:verdana,lucida;font-weight:bold}
.P12 {font-family:verdana,lucida;font-weight:bold}
.P19 {font-family:verdana,lucida;font-weight:bold}
.P22 {font-family:verdana,lucida;font-weight:bold;font-size:12px}
.P23 {font-family:verdana,lucida;font-weight:bold;font-size:12px}
--
/style
/head  $tmpfile.html

cat $tmpfile | tr  \n | sed s/$/''/g | grep -v '?xml
version=1.0 encoding=UTF-8?' | grep -v ^$ | egrep -v
text:table-of-content|text:index-title-template|text:index-entry-
style:font-decl|style:style|style:properties|style:tab
style:background|style:column|text:list-style
text:list-level-style-number|text:list-level-style-bullet
text:sequence-decl|number:number|office:script|office:font-decls
office:automatic-styles|table:table-column|table:table-header-rows |
sed s/'text:style-name='/'class='/g | sed s/'text:p'/'p'/g | sed
s/'office:body'/'body'/g | sed s/'office:document-content'/'html'/g |
sed s/'table:table '/'table border=1 cellspacing=0 cellpadding=2
style=border-style:solid;color:black'/g | sed s/'table:table-row'/'tr'
g | sed s/'table:table-cell'/'td'/g | sed s/'table:table'/'table'/g |
sed s/'text:unordered-list'/'ul'/g | sed s/'text:ordered-list'/'ol'/g |
sed s/'text:list-item'/'li'/g | grep -v ^[1-9]/p$ | grep -v ^[1-9
[0-9]/p$ | sed s/^\/td$/\nbsp;\/td/g  $tmpfile.html

if [[ $2 == text ]]
then
lynx -dump $tmpfile.html
fi
if [[ $2 == html ]]
then
cat $tmpfile.html
fi

rm -f $tmpfile

fi

-- 
Linux, the choice  | Abhängigkeit ist heiser, wagt nicht, laut
of a GNU generation   -o)  | zu reden.  -- Shakespeare, Rome und Julia  
Kernel 2.6.6   /\  | 
on a i686 _\_v | 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: [OT] XML entzippen

2004-06-14 Diskussionsfäden Michelle Konzack
Hallo Markus, 

Am 2004-06-14 20:43:09, schrieb Markus Raab:

Vielleicht heist es auch oo2txt, ich konnte es nicht mehr finden, darum
ist es im Anhang[0]

Das war wohl nichts...

Das Script ist als quoted-printable angekommen und hat es ist zerlegt 
angekommen. Kannst Du es noch mal als gzip senden bitte ?

Schönen Abend
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


Re: [OT] XML entzippen

2004-06-14 Diskussionsfäden Michelle Konzack
Am 2004-06-14 22:57:30, schrieb Rainer Bendig, Digitally Impressed:
Markus Raab schrieb am 14.06.2004 20:43:
Es handelt sich nur um ein Skript welches den xml Markup entfernt, der
Text bleibt übrig:
$ apt-get install xml2
sollte das übrige tun ...

habs allerdings nicht getestet 
xml2 - Convert between XML, HTML, CSV and a line-oriented format

Habe es gerade ausprobiert, aber entfernt nit die xml-Tags...
Der output ist auf alle fälle unlesbar.

(Und ich brauch nen anständigen reader ... grummel)

:-)

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature


[OT] XML entzippen

2004-06-13 Diskussionsfäden Jan Lühr
ja hallo erstmal,...

ich suche jetzt schon seit einiger Zeit nach einem netten Programm, dass 
komprimierte XML Dokumente (wie sie z.B. von OpenOffice oder k3b erzeugt 
werden) darstellt oder in lesbare XML-Dokumente umwandelt. (Nein, mozilla 
oder konqueror können es nicht).
Any hints?

Keep smiling
yanosz



Re: [OT] XML entzippen

2004-06-13 Diskussionsfäden Jrg Schtter
Hello Jan,

On Sun, 13 Jun 2004 12:51:58 +0200
Jan Lühr [EMAIL PROTECTED] wrote:

 ja hallo erstmal,...
 
 ich suche jetzt schon seit einiger Zeit nach einem netten Programm, dass 
 komprimierte XML Dokumente (wie sie z.B. von OpenOffice oder k3b erzeugt 
 werden) darstellt oder in lesbare XML-Dokumente umwandelt. (Nein, mozilla 
 oder konqueror können es nicht).
 Any hints?

unzip


Jörg

-- 
Jörg Schütter   http://www.lug-untermain.de/
[EMAIL PROTECTED] http://www.schuetter.org/joerg/
ICQ: 298982789  http://mypenguin.bei.t-online.de/



Re: [OT] XML entzippen

2004-06-13 Diskussionsfäden Jan Lhr
ja hallo erstmal,...

Am Sonntag, 13. Juni 2004 12:58 schrieb Jörg Schütter:
 Hello Jan,

 On Sun, 13 Jun 2004 12:51:58 +0200

 Jan Lühr [EMAIL PROTECTED] wrote:
  ja hallo erstmal,...
 
  ich suche jetzt schon seit einiger Zeit nach einem netten Programm, dass
  komprimierte XML Dokumente (wie sie z.B. von OpenOffice oder k3b erzeugt
  werden) darstellt oder in lesbare XML-Dokumente umwandelt. (Nein,
  mozilla oder konqueror können es nicht).
  Any hints?

 unzip

ARGS. Und ich verzuche zcat, zless, gunzip...

Keep smiling
yanosz



Re: [OT] XML entzippen

2004-06-13 Diskussionsfäden Pierre Gillmann
Hi,

  unzip
 
 ARGS. Und ich verzuche zcat, zless, gunzip...
Hättest du auch einfach in eine .zip umbenannt. Hätte auch das
gewünschte Ergebnis gebracht.

 Keep smiling
Greetz
 yanosz
Pierre


signature.asc
Description: Dies ist ein digital signierter Nachrichtenteil


Re: [OT] XML entzippen

2004-06-13 Diskussionsfäden Markus Raab
Jan Lühr wrote:

 ja hallo erstmal,...
 
 ich suche jetzt schon seit einiger Zeit nach einem netten Programm,
 dass komprimierte XML Dokumente (wie sie z.B. von OpenOffice oder k3b
 erzeugt werden) darstellt oder in lesbare XML-Dokumente umwandelt.
 (Nein, mozilla oder konqueror können es nicht).
 Any hints?

Es gibt sxw2txt damit du Openofficedokumente auch ohne Openoffice lesen
kannst.

xml ist außerdem lesbar...

mfg Markus

-- 
Linux, the choice  | Die Zeit ist der beste Lehrer. Leider tötet
of a GNU generation   -o)  | sie ihre Schüler.  -- Sprichwort  
Kernel 2.6.6   /\  | 
on a i686 _\_v | 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: [OT] XML entzippen

2004-06-13 Diskussionsfäden Michelle Konzack
Am 2004-06-13 15:56:37, schrieb Markus Raab:

Es gibt sxw2txt damit du Openofficedokumente auch ohne Openoffice lesen
kannst.

Und wo ist das ?
Ich finde es weder unter WOODY noch SARGE oder SID.

   ( 'apt-cache source sxw2txt' ) __
 /
|  Reading Package Lists...
|  Building Dependency Tree...
|  E: Unable to find a source package for sxw2txt
 \__

Ich habe übringends alle Packages.gz und Sources.gz von bo bis sid

xml ist außerdem lesbar...

mfg Markus

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917  ICQ #328449886
   50, rue de Soultz MSM LinuxMichi
0033/3/8845235667100 Strasbourg/France   IRC #Debian (irc.icq.com)


signature.pgp
Description: Digital signature