Moin, ich habe hier ein Abiword Dokument, was nicht mehr eingelesen werden kann. Leider sagt mir Abiword nicht, an welcher Stelle der Lesefehler auftritt. Nun möchte ich zumindest den Text retten. Ich habe mir mal das doc Format von Abiword angesehen, scheint eine HTML ähnliche Syntax zu haben, die Tags sind zwischen < und > geklammert. Da der Text zielmlich lang ist (ca. 40 Seiten, vielleicht ist das auch einfach zuviel für Abiword), wäre das löschen der Tags per Hand ziemlich aufwendig. Gib's es eine Lösung z.B. mit dem sed, der alle Zeichen zwischen < und > einschließlich dieser Zeichen löscht? Meine eigenen Versuche sind fehlgeschlagen:
sed "s/<*>//g" -> löscht nur die letzte ">" Grüße, Sven -- ----------------------------------------------------------- Um sich aus der Liste auszutragen schicken Sie bitte eine E-Mail an [EMAIL PROTECTED] die im Subject "unsubscribe <deine_email_adresse>" enthaelt. Bei Problemen bitte eine Mail an: [EMAIL PROTECTED] ----------------------------------------------------------- 675 eingetragene Mitglieder in dieser Liste.

