Hallo Michael,

Danke f�r Deine Antwort.


Du meintest am 01.05.04 um 19:11 Uhr:

> <[EMAIL PROTECTED]> wrote on 28.04.04:

>> Du meintest am 28.04.04 um 16:37 Uhr:

[ *HTML-Parser f�r Crosspoint* ]

>>> [...] [ DOS-f�hige Tools w�ren praktischer bzw. universeller als
>>> Programme, die nur unter 32-Bit-Windows laufen. ]

>> Ja, klar, aber der Windows-Version von PowerBASIC, die ich
>> benutzt habe, ist komfortabler als dessen DOS-Versionen.

> Kann man das Ganze nicht am Schlu� (ggf. nach entsprechenden
> Anpassungen) durch den DOS-Compiler jagen?

Daran habe ich schon gedacht, aber das ist eine Frage des Aufwandes  
und der Zeit: Prinzipiell geht so etwas leicht; aber konkret ist es  
u. U. sehr aufwendig, beispielsweise, wenn man in einem PB/CC- 
Programm auf Include-Dateien zur�ckgreift, die man nach und nach f�r  
andere PB/CC-Programme kodiert und auf Wiederverwertbarkeit hin  
angelegt hatte, es m�ssen halt alle, aber auch alle speziellen und  
neueren F�higkeiten von PowerBASIC f�r Windows und fast alle  
speziell f�r PB/CC kodierten Bibliotheksfunktionen neu als PB/DOS- 
Kode formuliert werden.

M�glicherweise mache ich es, aber ob ich dazu wirklich Zeit finde,
wei� ich noch nicht, ich kann das momentan nicht versprechen.
Ich werde mir den PB/CC-Kode mal genauer auf seine  
Abw�rtskonvertierbarkeit hin anschauen.


>> Ich habe vor ein paar Jahren so ein Tool [...] (Jack Ormans
>> "HTM-CLR.EXE von 1995/1996") in die "Chat Noir" hochgeladen;
>> es krankt, was die Anwendung mit Crosspoint betrifft, daran,
>> da� die Namen von Eingabe- und Ausgabedatei in einem Dialog
>> abgefragt werden.

> Es gibt auch welche, an die man den Dateinamen �bergeben kann.
> Ich hab' mal aus Jux schnell einige getestet, aber auf Anhieb
> keines gefunden, das wirklich brauchbare Ergebnisse produziert.

Ja, gibt es.
Das einzige, welches ich selber noch gefunden habe - in der Chat  
Noir - war �ber 100 KB gro�.  Mein Progr�mmchen ist derzeit etwa  
39.000 Byte klein.

>>> Ist nur die Frage, ob sie auch nach CP437 konvertieren
>>> k�nnen...

>> [ Mein Prog wandelt kodierte Zeichen wie "&nbsp;" um, ich habe
>> das �ber eine Datendatei gel�st, in der die zu �bersetzenden
>> Kodes paarweise mit dem gew�nschten Zeichen stehen. Der Anwender
>> kann diese Liste erweitern. ]

> Die M�glichkeit, da auch selbst Sonderf�lle konfigurieren zu
> k�nnen, ist sicher nicht schlecht, aber IMO sollte diese Datei
> schon ziemlich vollst�ndig sein [...]

Ansichtssache.  Ich habe auch nur Zeit und beim einzelnen Anwender  
tauchen meiner Erfahrung nach in der Praxis nur wenige Kodierungen  
auf.  Wer von mir ein kostenloses Programm nutzen m�chte, kann  
meines Erachtens schon mal die Zeit aufwenden, dann, wenn ein  
spezieller Kode auftaucht, der noch nicht in der Liste steht, diesen  
Kode an die Liste anzuh�ngen.  Sein Aufwand ist minimal und ich bin  
nicht die Tippse f�r alle Leute, die gerne vieles umsonst und fix  
und fertig haben m�chte, damit sie keine Hand mehr r�hren m�ssen.   
Ich meine damit keine bestimmte Person, sondern will nur ausdr�cken,  
da� dies eine in meinen Augen akzeptable Arbeitsteilung ist, wenn  
ich ein Programm liefere und der Anwender diese �bersetzungsliste  
f�r sich pflegt, sprich, nach und nach erweitert.

> und au�erdem gibt es ja ziemlich viele M�glichkeiten, Zeichen
> in HTML zu codieren.

Ja, ich wurde ca. zwei Jahre in solchen oder �hnlichen Fragen  
geschult.  ( Ich verzichte darauf, die T�tigskeitsbezeichnungen,  
dieser au�eruniversit�ren Abschl�sse zu benennen, weil ich fast nur  
erlebe, da� Leute sich zu arroganten Bemerkungen provoziert f�hlen,  
weil sie glauben, das w�re ja alles so l�ppisch, und weil es heute  
anscheinend als cool gilt, Witze �ber Qualifikationen zu machen, f�r  
die jemand mindestens zwei Jahre seines Lebens t�glich 8 Stunden   
und fast jede verf�gbare Mark investiert hat. )


> Das sollte so ein Programm IMO nicht mit einer Datei l�sen,
> sondern z.B. aus "&#x2552;" oder "&#64;" gleich das richtige
> Zeichen "errechnen" und pr�fen, ob es im gew�nschten
> Zielzeichensatz (der �ber einen Parameter anzugeben w�re)
> vorhanden ist und es selbst entsprechend konvertieren.

Ja, sehr richtig. :)   Daran habe ich inzwischen auch schon mal kurz  
gedacht, es bietet sich wirklich an, zumindest die numerischen Kodes  
berechnen zu lassen.


> Ansonsten w�rde das ja eine endlose Liste werden und man m��te
> sich f�r mehrere Codepages auch mehrere solcher Tabellen
> erstellen (unterstellt, das Programm soll �berhaupt mehrere
> Zielzeichens�tze unterst�tzen, aber f�r XP mu� es eben CP437
> sein).

> Theoretisch kann ja *jedes* Zeichen in einer Datei codiert
> sein...

Ja, sch�n, aber es geht doch um ein Programm f�r die Praxis, ich  
wollte mal ausprobieren, ein Programm zu schreiben, da� schnell  
hilft.  Perfektionismus nur um des Perfektionismus' willen, war  
diesmal nicht mein Ziel.


> Insofern hatte ich mich auch schon gewundert, wie Du so schnell
> einen HTML-Parser geschrieben hast, denn das ist nicht ohne, wenn
> man es richtig machen will.

Es sollte 'nen Parser f�r HTML-Mails und f�r die Zusammenarbeit mit  
Crosspoint sein, keiner der Homesite Konkurrenz machen m�chte.
Ich bin der Ansicht, da� das Worte "richtig" oder "falsch" nicht  
passen, weil mein Programm nur richtig oder falsch sein kann bezogen  
auf mein Ziel; und mein Ziel war, zu versuchen, schnell ein Programm  
zu schreiben, das in der Praxis hilft.  Das pers�nliche Ziel, einen  
aufschlu�reichen Programmierversuch zu unternehmen, habe ich  
erreicht, und das andere: helfen kann das Programm anderen auch; ich  
habe also nichts falsch gemacht.  Perfektionismus oder  
Vollst�ndigkeit sind nicht immer vern�nftige Ziele; sondern nicht  
selten eine Art Wahnzustand.  ;)


> Es mu� ja auch den Zeichensatz der HTML-Mail im Content-Tag
> auswerten k�nnen (statt "&uuml;" kann dort ja auch einfach ein
> 8bit-Zeichen stehen), und UTF-7/8-f�hig sollte es nat�rlich auch
> sein...

Man kann jedes kleine Tool so weit ausbauen, bis es ein  
schwerf�lliger Bolide ist, der jede Eventualit�t abzufangen trachtet  
und dessen Funktionen irgendwann weder der Programmierer noch die  
Anwender leicht �berschauen k�nnen.

Fachlich und im Prinzip gebe ich Dir aber recht und begr��e Deine  
konstruktiven Hinweise.  :)

Wie weit ich den Perfektionismus bei diesem Programm noch treibe,  
h�ngt davon ab, wieviel Zeit ich daf�r er�brigen kann und m�chte.


> [...] [ Sowas hier sollte man IMO nicht einfach entfernen: ]
>
> ----------8<----------
> <a href="http://www.yol3.us/cs/lz/";>Start now!</a><br>
> ----------8<----------
>
> [ Denn das ist zwar ein Tag, aber es enth�lt Information. ]

Ja. Ist mir auch schon durch den Kopf gegangen, als ich mir das  
verschickte Beispiel noch einmal kurz angeguckt habe.


> Auch sowas auszuwerten und entsprechend aufbereitet darzustellen,
> ist nicht trivial.

M�glich; ich w�rde sagen, es ist trivial, aber aufwendig und u. U.  
auch kompliziert.  So ist es aber IMO beim Programmieren oft: Die  
einzelnen Dinge sind trivial, aber zig auf einander bezogene  
Trivialit�ten wollen auch erst einmal geb�ndigt sein.  (Worte jagen  
Worte, die Worte jagen, die Worte jagen.)  ;)


Gru� elek

------------------------------------------------------------------------
FreeXP Support-Mailingliste
[EMAIL PROTECTED]
http://www.freexp.de/cgi-bin/mailman/listinfo/support-list

Antwort per Email an