"Roland M. Kruggel" <[EMAIL PROTECTED]> writes: > Hallo Liste, > > ich suchen in mehreren ascii-Dateien non-ascii Zeichen.
Das w�ren alle au�erhalb des Bereichs 0x00..0x7f. > Also alles was nicht Buchstabe, Zahl, Was ist mit � oder �? oder kyrillischen Buchstaben? > Umlaut Und das h�ngt v�llig vom verwendeten Zeichensatz ab. Ich fange jetzt lieber nicht auch noch vom Euro an. > oder Sonderzeichen Das h�ngt von der Definition und auch vom Zeichensatz ab. Ich f�rchte, du musst die Aufgabenstellung genauer kl�ren. Wenn man den einfachsten Fall annimmt, m�chtest du alle nicht-druckbaren ASCII-Zeichen. Dann w�rde so was reichen: sed 's/[^ -~]/#/g' um alle zu ersetzen. Weitere Buchstaben, die du ersetzen willst, kannst du direkt hinter den ^ oder ~ schreiben (einfach aufz�hlen). Insbesondere bei den Umlauten sehe ich Probleme, da es daf�r zwei g�ngige Codierungen gibt. Nicht umsonst hat jede Mail hier einen Header, der den Zeichensatz liefert, sofern ASCII nicht ausreicht. Wenn du Umlaute haben willst, kann es ziemlich kompliziert werden. Es spielt ja nicht nur der Zeichensatz in der zu bearbeitenden Datei eine Rolle, sondern auch noch der, in der sich dein sed-Ausdruck befindet. Vielleicht reicht es ja schon wie oben, auch wenn das Ergebnis schwerlich portabel sein wird. Ansonsten solltest du vielleicht genauer beschreiben, was du machen willst. Gru�, Heike -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)

