On 21 Dec 2004 at 12:31, Ivo Looser wrote:
> Hallo Bernd
>
> Mit Wortgrenze ist's sch�ner.
>
> Jedoch matcht \w bei ��� nicht, dann w�rde die Expressen beim wort
> "H�llenregexp" kein ergebnis liefern.
Tja, vergass ich glatt - \w entspricht Wortbestandteilen in
(US)ASCII.
> Da w�re dann also:
> \b[A-Z���][a-z���]+\b
>
> Lustig wird's bei: "Herrschaft's zeiten" :-)
Na dann bessern wir nach:
\b[A-Z���][a-z����'\-]+\b
Das sollte so einigermassen alles abdecken was so in Worten
rumlungert. Ausgenomm�n nat�rlisch Frans�sische Akzengs...
Aber daf�r gibts in .NET Regexen eh entsprechende Unicode-
Charklassen.
Bernd
Hmm. Y'know, there are other possibilities if we assume that
filenames
are UTF-8...yikes...wait, put down that meat cleaver! Aieeee!!!
--Larry Wall
_______________________________________________
Coffeehouse Mailingliste, Postings senden an:
[email protected]
An-/Abmeldung und Suchfunktion unter:
http://www.glengamoi.com/mailman/listinfo/coffeehouse