Frank Markopoulos <[EMAIL PROTECTED]> wrote on 22.05.04:

> [EMAIL PROTECTED] (Michael Heydekamp) teilte uns am 22.05.04 mit:

>>> Wie bekomme ich die Datei denn eingelesen

>> Puffer kannst Du generell mit X/I/P einlesen,  Wenn sie aber im BAD
>> gelandet sind, natuerlich nicht, denn sie sind ja deswegen da
>> gelandet, weil sie nicht OK sind.

> Ich hatte jetzt auch diesen Fall (k�nnte sogar DERSELBE Artikel wie
> bei Harald gewesen sein...) -

Wenn das so ist, ist auch sein Problem bereits behoben.

> mein Puffer (_diesmal_ liegt er mir noch vor ;-) ist an die "dev"-
> Adresse unterwegs (_ohne_ Belgleitkommentar!).

Thx, das hat schon mal geholfen.  Kommentar dazu siehe unten.

>> Vermutlich, weil Du eine oder mehrere defekte Nachrichten im Spool
>> liegen hast, und die werden halt nicht geloescht, solange der Puffer
>> nicht korrekt konvertiert und eingelesen wird.

> Du h�ttest Harald auch gleich noch schreiben k�nnen, *wie* es geht:

Das Reparieren mit ZPR behebt aber das eigentliche Problem nicht.   
Danach kann man den Puffer zwar einlesen, aber er ist immer noch defekt
decodiert/konvertiert.

>> Also bitte mal die *.MSG oder *.IN, die sich nach einem Netcall bei
>> Dir im Spoolverzeichnis der Box (<XP>\Spool\<Boxname>) befinden, als
>> ZIP herschicken.

> Done. :-)

Ich hab' mir das kurz angesehen: Es geht bei mindestens einem Posting im
Grunde um dasselbe Problem, das auch Hans-J�rgen T�nzer schon vor
einiger Zeit gemeldet hatte und das Anla� f�r einen ziemlich umfassenden
Umbau des UUZ im Bereich Decodierung von UTF-7/8 und qp/base64 war.

Erstmal ist festzuhalten, da� das Posting mit der MsgID
<[EMAIL PROTECTED]>
v�llig defekt ist:

Es ist als UTF-8 deklariert, enth�lt aber nicht nur UTF-8-codierte
Zeichen, sondern einen Mix aus UTF-8 und ganz normalen ISO-Zeichen (die
zus�tzlich qp-codiert sind), z.B. hier:

----------8<----------
> > Wurde sein Linux/Mac/was weiss ich Rechner gehackt, d=FCrfte das wenig
                                                         ^^^
> > helfen.
>=20
> Bitte ankreuzen, was f=FCr ein anderes OS nicht zutrifft:
                        ^^^
----------8<----------

Da kommt dann wie schon bei Hans-J�rgens Posting, bei dem ein �hnliches
Problem vorlag, die UTF-8-Routine durcheinander und erzeugt u.a.
ZC-Puffer mit einem falschen LEN-Header.  Dar�ber hinaus werden die ISO-
Zeichen nat�rlich auch nicht nach IBM konvertiert, weil der UUZ ja von
UTF-8 ausgeht (bisher jedenfalls).

Wer sich solche tollen MsgIDs einfallen l��t, sollte dann wenigstens
nicht selbst so einen Schrott produzieren.

Anyway, davon abgesehen liegt hier nat�rlich auch ein schon l�nger
bestehender Bug (oder eine Nachl�ssigkeit) im UUZ vor, die ich anl��lich
des Reports von HJT vor l�ngerem ausf�hrlich erl�utert hatte und die
inzwischen behoben ist.

Bei diesem Posting kommt zus�tzlich noch das Problem hinzu, da� die
UTF-8-Sequenzen ebenfalls qp-codiert sind.  Das ist OK, hat aber den UUZ
bisher veranla�t, zwar eine qp-Decodierung, nicht aber die anschlie�end
erforderliche UTF-8-Decodierung vorzunehmen.  Auch das ist nat�rlich
bereits behoben.

Ich wu�te nicht, da� es solche Mix-Postings (UTF-8 und ISO-8859-x)
tats�chlich gibt, aber dann ist die neue UUZ-Routine ja noch viel
realit�tsnaher als ich dachte: Die decodiert n�mlich jetzt nicht nur die
qp-codierten UTF-8-Sequenzen korrekt, sondern konvertiert auch die ISO- 
Zeichen, die jetzt als ung�ltige UTF-8-Sequenz erkannt werden, nach IBM
und stellt sie in XP korrekt dar.  Das kann vermutlich kein anderer
Newsreader. :)

Ich schicke zum Vergleich mal ein OLD_NEW.ZIP in das dev-Forum (mit
Bezug auf dieses Posting, einfach "#" im Lister dr�cken).  Darin ist ein
UUZ_OLD.PUF und ein UUZ_NEW.PUF enthalten. In beiden einfach mal nach
dem String "utf-8" suchen und das Ergebnis des alten und neuen UUZ im
direkten Vergleich betrachten, die Unterschiede sind augenf�llig.

Und nicht wundern - das hier ...

----------8<----------
> Bitte ankreuzen, was f�r ein anderes OS nicht zutrifft:
> [ ] You can�t clean a compromised system by patching it.
             ^
> [ ] You can�t clean a compromised system by removing the back doors.
             ^
> [ ] You can�t clean a compromised system by using some 'vulnerability
             ^
----------8<----------

... ist kein Fehler des UUZ, sondern einfach ein korrekt decodiertes und
konvertiertes "=FF", und das ist in ISO-8869-1 und Windows-1252 nun mal
das Zeichen "�".  Im RFC-Original sieht das so aus:

----------8<----------
> Bitte ankreuzen, was f=FCr ein anderes OS nicht zutrifft:
> [ ] You can=FFt clean a compromised system by patching it.
> [ ] You can=FFt clean a compromised system by removing the back doors.
> [ ] You can=FFt clean a compromised system by using some =B4vulnerability
----------8<----------

Warum diese Zeichen da �berhaupt enthalten sind, m��t Ihr den Poster
fragen, KI hat der UUZ noch nicht. ;)

Ich wei�, da� jetzt alle fragen werden, wann denn der neue UUZ
erscheinen wird.  Ich schraube noch und wei� nicht, ob ich bis n�chsten
Samstag (da fahre ich in Urlaub) fertig werde.  Aber falls nicht, werde
ich auf jeden Fall den aktuellen Stand als Testversion auf den FTP- 
Server legen.

Ich bin hier gleichzeitig mit der Umstellung unseres Servers auf Win2K
und der Workstations auf WinXP besch�ftigt und mu� bis Samstag hier auch
was Lauff�higes stehen haben, deshalb habe ich noch weniger Zeit als
ohnehin schon.  Ich geb mir M�he, aber ich kann nix versprechen.


        Michael
------------------------------------------------------------------------
FreeXP Support-Mailingliste
[EMAIL PROTECTED]
http://www.freexp.de/cgi-bin/mailman/listinfo/support-list

Antwort per Email an