Text von Unerwünschtem befreien

Problem: Ich habe eine lange Textdatei, die sowohl Fragen als auch unerwünschte Formatierungszeichen und -zeilen enthält. Ich suche jetzt nach einer Möglichkeit, mit wenig Aufwand alles - abgesehen von den Zeilen mit den Fragen - aus dieser Datei zu löschen. Geht das überhaupt?

von Gaby Salvisberg 12.03.2010

Lösung: Das Textmuster, das Sie mitgeliefert haben, sieht ungefähr so aus:

f1001
Welches dieser Zeichen bedeutet "Festmacheverbot"?
1
2
3
33Verbot: Festmachen
sign05.bmp,sign08.bmp,sign13.bmp
f1002
Bei welchem Signal ist das Wasserskifahren verboten?
1
2
3
32Verbot: Wasserskifahren
sign04.bmp,sign06.bmp,sign07.bmp
f1003
Bei welchem dieser Signale ist die Durchfahrt für Segelschiffe verboten?


Sie hätten aus einem langen Textfile mit solchen Inhalten gerne einen «Extrakt», der nur die Zeilen mit den Fragen enthält. Sie könnten den Text ins Excel kopieren. Hier wäre etwa der Einsatz von Daten/Filter/AutoFilter denkbar: Wenn Sie nach «endet mit ?» filtern, sollten nur die Zeilen mit den Fragen stehenbleiben.

Das Linux-Tool Grep gibts auch für Windows Das Linux-Tool Grep gibts auch für Windows Zoom Viel eleganter lösen Sie das Problem aber per Konsole. Wären Sie ein Unix- oder Linux-User, würden Sie in einem Konsolenfenster in den Ordner mit der Fragedatei (z. B. FragenMitMuell.txt) wechseln und das eintippen:
grep ?$ FragenMitMuell.txt > FragenOhneMuell.txt

Das kopiert innert Sekunden alle Zeilen, die mit einem «?» enden, aus der Ursprungsdatei FragenMitMuell.txt in die neue, bereinigte Datei namens FragenOhneMuell.txt. Falls Sie Grep auch mal unter Windows ausprobieren wollen: Laden Sie von Sourceforge die UnxUtils herunter, entzippen Sie sie in einen Ordner und nehmen Sie den wbin-Ordner in den Pfad (path) auf.

Das Windows-Bordmittel heisst find Das Windows-Bordmittel heisst find Zoom

Es gibt aber auch ein Windows-Bordmittel, das ähnlich wie Grep funktioniert:

find "?" FragenMitMuell.txt > FragenOhneMuell.txt

Auch das schreibt die Zeilen, die ein Fragezeichen enthalten, in eine neue Datei namens FragenOhneMuell.txt. (PCtipp-Forum)

Tags: Linux

    Artikel zum Thema:

    Kommentare

    Keine Kommentare

    Sie müssen eingeloggt sein, um Kommentare zu verfassen.