On 21 Dec 2004 at 12:31, Ivo Looser wrote:

> Hallo Bernd
>
> Mit Wortgrenze ist's sch�ner.
>
> Jedoch matcht \w bei ��� nicht, dann w�rde die Expressen beim wort
> "H�llenregexp" kein ergebnis liefern.

Tja, vergass ich glatt - \w entspricht Wortbestandteilen in
(US)ASCII.

> Da w�re dann also:
> \b[A-Z���][a-z���]+\b
>
> Lustig wird's bei: "Herrschaft's zeiten" :-)

Na dann bessern wir nach:

 \b[A-Z���][a-z����'\-]+\b

Das sollte so einigermassen alles abdecken was so in Worten
rumlungert. Ausgenomm�n nat�rlisch Frans�sische Akzengs...
Aber daf�r gibts in .NET Regexen eh entsprechende Unicode-
Charklassen.

             Bernd

Hmm. Y'know, there are other possibilities if we assume that
filenames
are UTF-8...yikes...wait, put down that meat cleaver! Aieeee!!!
            --Larry Wall


_______________________________________________
Coffeehouse Mailingliste, Postings senden an:
[email protected]
An-/Abmeldung und Suchfunktion unter:
http://www.glengamoi.com/mailman/listinfo/coffeehouse

Antwort per Email an