Tipps & Tricks 12.03.2010, 11:21 Uhr

Text von Unerwünschtem befreien

Problem: Ich habe eine lange Textdatei, die sowohl Fragen als auch unerwünschte Formatierungszeichen und -zeilen enthält. Ich suche jetzt nach einer Möglichkeit, mit wenig Aufwand alles - abgesehen von den Zeilen mit den Fragen - aus dieser Datei zu löschen. Geht das überhaupt?
Lösung: Das Textmuster, das Sie mitgeliefert haben, sieht ungefähr so aus:
Information
f1001Welches dieser Zeichen bedeutet "Festmacheverbot"?12333Verbot: Festmachensign05.bmp,sign08.bmp,sign13.bmpf1002Bei welchem Signal ist das Wasserskifahren verboten?12332Verbot: Wasserskifahrensign04.bmp,sign06.bmp,sign07.bmpf1003Bei welchem dieser Signale ist die Durchfahrt für Segelschiffe verboten?

Sie hätten aus einem langen Textfile mit solchen Inhalten gerne einen «Extrakt», der nur die Zeilen mit den Fragen enthält. Sie könnten den Text ins Excel kopieren. Hier wäre etwa der Einsatz von Daten/Filter/AutoFilter denkbar: Wenn Sie nach «endet mit ?» filtern, sollten nur die Zeilen mit den Fragen stehenbleiben.
Viel eleganter lösen Sie das Problem aber per Konsole. Wären Sie ein Unix- oder Linux-User, würden Sie in einem Konsolenfenster in den Ordner mit der Fragedatei (z. B. FragenMitMuell.txt) wechseln und das eintippen:
grep ?$ FragenMitMuell.txt > FragenOhneMuell.txt
Das kopiert innert Sekunden alle Zeilen, die mit einem «?» enden, aus der Ursprungsdatei FragenMitMuell.txt in die neue, bereinigte Datei namens FragenOhneMuell.txt. Falls Sie Grep auch mal unter Windows ausprobieren wollen: Laden Sie von Sourceforge die UnxUtils herunter, entzippen Sie sie in einen Ordner und nehmen Sie den wbin-Ordner in den Pfad (path) auf.
Das Windows-Bordmittel heisst find
Es gibt aber auch ein Windows-Bordmittel, das ähnlich wie Grep funktioniert:
find "?" FragenMitMuell.txt > FragenOhneMuell.txt
Auch das schreibt die Zeilen, die ein Fragezeichen enthalten, in eine neue Datei namens FragenOhneMuell.txt. (PCtipp-Forum)



Kommentare
Es sind keine Kommentare vorhanden.