Tipps & Tricks 30.06.2005, 22:00 Uhr

Eingescannte Texte in PDF konvertieren

Mit meinem Kombigerät HP PSC 750 gibt es für eingescannte Texte sehr wenige verschiedene Dateiformate als Speichermöglichkeiten. Wie kann ich eingescannte Texte oder Dokumente als PDF-Datei erhalten? JPG oder BMP sind mir zu gross.
Grundsätzlich lässt sich nicht sagen, dass das Dokumentenformat PDF kleinere Dateigrössen erzeugt als das Bildformat JPG. Denn PDF kennt keine eigene Bildkompression, sondern kann zur platzsparenden Speicherung von Bildern die JPG-Kompression verwenden. Somit macht es aus Gründen der Dateigrösse keinen Sinn, Bilder anstatt dem JPG-Format im PDF-Format zu verwenden. Gegenüber dem unkomprimierten BMP-Format sind aber beide platzsparender. Sollen die Bilder jedoch z.B. für den Datentausch als PDF vorliegen, kann man sie beispielsweise mit der Freeware "pdf995" [1] umwandeln.
Ist der eingescannte Text in der PDF-Datei hingegen als tatsächlicher Text und nicht als Bild gespeichert, ist der Grössenunterschied natürlich immens grösser. Dazu benötigen Sie eine sogenannte OCR-Texterkennungs-Software, welche die Zeichen erkennen und in Text umwandeln kann. Kostenpflichtige Programme wie "OmniPage" [2] oder "FineReader" [3] erledigen diese Aufgabe mittlerweile sehr exakt. Das Programm "SimpleOCR" [4] ist Freeware, erkennt derzeit jedoch nur Englische und Französische Sprache.


Kommentare

Es sind keine Kommentare vorhanden.