> re.sub(r'\n(%s)' % re_lower, r'\1', x)
Diky!
> re_lower = ur'[%s]' % string.lowercase.decode('cp1250')
Taky dik!
Ale jestli muzu, mel bych jeste dva dotazy:
1. Jak udelat, aby v tom re_lower byly vsecky lowercase znaky z
UTF-8? Tedy nejen ty z cp1250 nebo iso-8859-2, ale i iso-8859-1,
iso-8859-5 (cyrilice), rectina, to by mozna uz stacilo... Spojit ty
stringy a vyhodit duplicity? Nebo by to slo nejak jednodusejs?
2. Jak udelat, abych vstupni soubor v utf-8 nacet opravdu jako utf8 string?
_______________________________________________
Python mailing list
[email protected]
http://www.py.cz/mailman/listinfo/python