News 30.05.2007, 08:45 Uhr

Anti-Spam-Funktion digitalisiert Bücher

Als Anti-Spam-Massnahme muss man oft bei Webformularen eine Zeichenfolge abtippen. Diese eher lästige Tipperei lässt sich dazu nutzen, Bücher zu digitalisieren.
Nicht nur E-Mail-Konten werden vollgespamt, auch Webformulare. Die Spamsoftware füllt das Formular automatisch aus und sendet es ab. Ein verbreitetes Mittel, dem vorzubeugen, besteht darin, dass eine abgebildete Buchstabenfolge abgetippt werden muss, denn dies ist eine Aufgabe, die nur Menschen erledigen können.
Forscher der Carnegie Mellon University haben nun ein Projekt namens Recaptcha ins Leben gerufen, welches das eher lästige Abtippen zu einer nützlichen Arbeit macht. Zum Eintippen werden nicht zufällig generierte Buchstabenfolgen vorgelegt, sondern Wörter aus Büchern. Und zwar solche, die digitalisiert werden sollten, aber von der automatischen Schrifterkennung nicht gelesen werden konnten.
Weil das System die Lösung für diese Wörter noch gar nicht kennt, wird ein noch unbekanntes Wort sowie ein Wort vorgelegt, deren Lösung bereits bekannt ist. Wird das bekannte Wort richtig getippt, so geht die Software davon aus, dass auch das andere Wort korrekt entziffert wurde. Zur Kontrolle wird es dann weiteren Benutzern vorgelegt.
Die Initianten schätzen, dass weltweit pro Tag 60 Millionen solche Abtipp-Aufgaben gelöst werden und dabei 150'000 Stunden Arbeit geleistet wird. Wird diese Arbeit sinnvoll genutzt, hat sie also ein enormes Potenzial.
Recaptcha [1] lässt sich kostenlos und relativ einfach in die eigene Webseite einbinden. Es braucht dazu kein Formular, auch die eigene E-Mail-Adresse kann mit dem Verfahren geschützt werden.

Autor(in) David Lee



Kommentare
Es sind keine Kommentare vorhanden.