News 15.04.2013, 09:54 Uhr

Software erkennt heisse News auf Wikipedia

Forscher konnten aufgrund der Aktivität auf Wikipedia wichtige Ereignisse des Weltgeschehens automatisch eruieren.
Ein internationales Forscherteam um den deutschen Google-Mitarbeiter Thomas Steiner hat eine Software entwickelt, die anhand von Wikipedia-Einträgen erkennt, was aktuell heisse Nachrichten sind. Dazu beobachtet der in einer Live-Demo vorliegende «Wikipedia Live Monitor» die Änderungen, die an Artikeln vorgenommen werden. Denn viele gleichzeitige Bearbeitungen in verschiedenen Sprachversionen sind ein Zeichen, dass es wirklich eine weltbewegende Neuigkeit gibt - wie ein regelrechter Bearbeitungskrieg nach dem Tod Michael Jacksons 2009 gezeigt hat.
Nach Angaben von Steiner gibt es verschiedene Ideen, wie die neue Software in Zukunft eingesetzt werden könnte. Die wohl offensichtlichsten sind, Daten für ein News-Ranking heranzuziehen oder die Klassifizierung von Nachrichten zu erleichtern. Aber auch andere Anwendungen wie eine «Storification» von News durch die Verbindung von Social Media mit Wikipedia-Inhalten wären denkbar.
Bearbeitung zeigt Aufreger
Die Idee hinter der Software ist eigentlich einfach. Gibt es eine aktuelle Nachricht, die wirklich viele Menschen bewegt, führt das im Informationszeitalter auch dazu, dass es sehr schnell zu vielen Bearbeitungen passender Wikipedia-Einträge kommt. Nach dem Jackson-Tod beispielsweise haben etliche User praktisch gleichzeitig versucht, seinen Wikipedia-Eintrag um Todeszeitpunkt, Umstände des Todes und andere Details zu ergänzen. Die Software beobachtet also die Änderungsaktivität bei diversen Sprachversionen der Wikipedia und identifiziert anhand von gleichzeitigen Bearbeitungen äquivalenter Artikel in diversen Sprachen mögliche Kandidaten für heisse News.
Nächste Seite: Es funktioniert!

Es funktioniert!

Vergangenen Freitag konnte Pressetext beobachten, wie schnell das funktioniert, denn da gab es die Auslosung für das Halbfinale der UEFA Champions League. Anhand der vielen Änderungen an Wikipedia-Artikeln zur Fussball-Eliteliga hat der Wikipedia Live Monitor binnen kürzester Zeit auf ein heisses Thema geschlossen. Freilich war hier vorab klar, dass es ein heisses Thema gibt. Interessanter dürfte die Software für unerwartete Ereignisse sein, wobei den Forschern zufolge ein zusätzliches Erfassen von Wikipedia-Klassifizierungen sinnvoll wäre. Denn wird beispielsweise jemand aus der Kategorie «lebende Personen» gestrichen, ist das ein Hinweis auf einen aktuellen Todesfall.
Abschätzen, was wichtig ist
Das System erlaubt dem User schon jetzt, Vorgaben zu machen - beispielsweise, wie viele Bearbeitungen von äquivalenten Artikeln es geben muss und wie viele verschiedene Nutzer die Änderungen vornehmen müssen, ehe das System etwas als «Breaking News»-Kandidaten einstuft. Dabei geht es Steiner zufolge darum, dass einzelne Nutzer sinnvolle Abschätzungen bekommen, was aus ihrer Sicht wichtig genug und somit relevant ist. Gerade mit geplanten Erweiterungen würden sich noch zusätzliche Möglichkeiten eröffnen - beispielsweise, dass ein angebundenes System automatisch mit dem Liveschalten passender Storys auf einen Promi-Storyfall reagiert.
Das ist vorerst aber noch Zukunftsmusik, doch glauben die Entwickler an das Potenzial des quelloffenen Wikipedia Live Monitors, den sie Mitte Mai auf der World Wide Web Conference näher vorstellen werden. So habe die Software gegenüber dem Ansatz, aktuell wichtige Nachrichten automatisch an Postings auf sozialen Netzwerken zu erkennen, den Vorteil, dass es selten zu «False Positives» - einem Einstufen unwichtiger Nachrichten als grosse News - kommt. Wirklich Wichtiges werde aber ebenso gut erkannt und das letztlich mit viel weniger Rechenaufwand.
Text: Pressetext.com/Thomas Pichler

Autor(in) Pressemeldung



Kommentare
Es sind keine Kommentare vorhanden.