Re: [de-users] Und wieder: Formatfehler in Teildokument content.xml

Christian Lohmaier Mon, 05 Nov 2007 05:59:08 -0800

Hallo Agon, *,

On 10/24/07, Agon S. Buchholz <[EMAIL PROTECTED]> wrote:
> Michael Höhne wrote:
>
> Wenn du mir ein Programm sagst, das zuverlässig an eine "Spalte 728384"
> springen kann, dann könnte ich das tatsächlich versuchen ;-/


vim kann das. Sollte eigentlich jeder brauchbare Editor können.

Aber auch wenn er es nicht kann, kann man es dem Nutzer und dem Editor
leichter machen, in dem man Zeilenumbrüche in die Datei einfügt.
z.b. aus "><" ein ">\n<" macht. Dann werden die Zeilen kürzer und das
Editieren/Navigieren wird deutlich einfacher.

Die Zeilenumbrüche kann man entweder mit vim einfügen oder per
sed oder einem anderen geeigneten Tool.

> Wenn ich "content.xml" mit Ultraedit öffne und an das Dokumentende (also
> das Ende von Zeile 2) springe, dann sagt mir die Statusleiste: "Zeile:
> 2, Spalte 54174, C" und "U8-UNI".

Ja, leider ist die Option "Pretty printing" in den Optionen standardmäßig
deaktiviert, bzw. steht auf "Dateiformat auf Größe optimieren" - und da
wird der gesamte Inhalt in eine Zeile gepackt. (bzw. Zwei, wenn man die
erste mitzählt)

> Ultraedit bietet ansonsten nur die
> Funktion "Gehe zu Zeile/Seite", nicht jedoch so etwas wie "Gehe zu Spalte".

Ultraedit bietet aber bestimmt suchen und ersetzen, mit dem Du die
oben erwähnten Zeilenumbrüche einfügen kannst. Dann nochmal
in ein Dokument packen, damit dir OOo die neue Fehlerposition ansagt,
und dann kanns weiter gehen.

> Abgesehen davon wüsste ich selbst dann nicht wirklich, was ich machen
> könnte; im Hex-Modus sieht bspw. die Stelle ".A.1" folgendermaßen aus:
> "00 41 00 31".

Wirklich mit null-bytes dazwischen? Sollte AFAIK nicht der Fall sein.
für ASCII ist UTF-8 genau dasselbe, macht also keinen Unterschied ob
da "A1" in ASCII oder UTF-8 kodiert ist. Aber in keinem Fall sollten
da Null-bytes dazwischen sein.

Kann aber natürlich auch an der Darstellung im Hexeditor liegen, wer weiß..

> Weit und breit beginnt davor und dahinter nichts mit "11
> 11 0x" oder "10 xx".

Ebenfalls. Für ASCII (oder ANSI, bring die beiden immer durcheinander)
gibts keinen Unterschied zu UTF-8. die byte-Kodierungen betreffen nur
die nicht darin enthaltenen Zeichen (wie z.B. die Umlaute äüöß oder
alle anderen möglichen Zeichen)

> Ich weiß ja nicht einmal, ob die von Validome
> angegebene Position überhaupt fehlerhaft ist und was OOo erwarten würde.
> Aber wie gesagt, ich habe leider absolut keine Ahnung davon, wie ich
> einen Unicode-Text mit einem Hex-Editor bearbeite.

Ab besten überhaupt nicht...

Die Fehler, die OOo selbst findet sind ja alles syntax-Fehler, und haben
i.d.R. nur nebensächlich was mit der Semantik zu tun.

Also wenn die Syntax sagt: Es darf an dieser Stelle nur eines der folgenden
Elemente stehen (und jedes Element maximal ein einziges Mal), und
es stehen aber zwei der Elemente an der Stelle, dann meckert der Parser.

(z.B. wenn man Dateien mit der frühen 2.0erBeta bearbeitet hat, kanns
passieren, daß Attribute doppelt forkommen. Das ist ein Syntaxfehler und
OOo meckert die entsprechende Position an.

ciao
Christian

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Re: [de-users] Und wieder: Formatfehler in Teildokument content.xml

Antwort per Email an