Hallo Andre,

On Tue, Feb 18, 2003 at 08:30:50PM +0100, Andre Fischer wrote:
> ich m�chte in einer Zeile die enthaltene URL separieren. Meistens steht da 
> aber immer noch was davor und dahinter. Das davor ist ja kein problem, das 
> mach ich mit sed s/^.*http:/http:/g. aber wie l�sche ich ab dem ersten "ich 
> darf nicht in einer URL enthalten sein"-Zeichen bis zum Zeilenende?

Du k�nntest nat�rlich nach allen nach RFC 2396 (Anhang A) erlaubten Zeichen
suchen. So als Schnellschu� w�rde ich aber eher nach Leerzeichen und
Tabulatoren Ausschau halten:

s/^.*\(http:[^ \t]\+\).*/\1/

Du mu�t auch noch schauen, ob in den Zeilen nicht vielleicht 2 URLs
enthalten sind. Der g-Schalter hinter dem s/// n�tzt Dir in deinem Beispiel
genau so wenig wie in meinem, selbst wenn du das ^ wegl��t. Grund: greedy
match des * Metachar. Probiere es am besten mal an der Zeile

blabla http://eins/ suelz http://zwei laber

aus.

In meinem Beispiel mu�t Du noch \t durch ein echtes Tab-Zeichen (unter Bash:
Ctrl-V TAB) ersetzen.

Ansonsten gibt es da vielleicht ein sch�nes Perl-Modul zu, welches Dir die
Arbeit abnimmt. Oder Du schaust, ob du mit den Sourcen von urlview etwas
anfangen kannst.

Gru�,
 Mike


--
Haeufig gestellte Fragen und Antworten (FAQ):
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)

Antwort per Email an