News 28.11.2013, 13:19 Uhr

Schnell das ganze Wikipedia herunterladen

Verreisen Sie nächstens für ein paar Wochen in einen korrupten Militärstaat und wollen das ganze Wikipedia dabeihaben? Das geht – in nur 30 Stunden.
Ein paar Hobbycoder mussten sich letzthin einen kleinen Spass ausgedacht haben. Mit dem Tool Dubbed Xowa ist es möglich, eine Offline-Kopie von Wikipedia anzulegen. Es dauert lediglich 30 Stunden. Das Tool lädt etwa 4,4 Millionen Wikipedia-Artikel in vollem HTML-Format herunter. Wikiquote und Wiktionary können auch zum Download selektiert werden, damit auch wirklich alle Links funktionieren.

13,9 Millionen Seiten

Wikipedia beinhaltet so einiges an Daten. Die englische Version mit 4,4 Millionen Artikeln verteilt sich auf etwa 13,9 Millionen Seiten. Das sind etwa 20 Gigabyte Text und 3,7 Millionen Thumbnails. Die Einstellungen, um die Inhalte herunterzuladen, sind schnell bewerkstelligt. Der massive Download belegt total etwa 80 GB auf der Festplatte. Wenn Sie die Bilder auch wollen, brauchen Sie etwa 100 GB freien Speicherplatz – und eben: etwa 30 Stunden braucht dann aber Ihr Rechner, um die Inhalte zu verarbeiten. 80 GB ist zwar viel Speicher, der während der Formatierungsaufbereitung auf dem Rechner benötigt wird – schlussendlich belegt die ganze Kopie (ohne die Auslagerungsdateien) aber «nur» 25 GB Speicher.

Simple Wikipedia

Wenn Sie den Download nicht während eines ganzen Tages durchführen wollen, empfehlen die Xowa-Entwickler, zunächst eine abgespeckte Wikipedia-Version herunterzuladen. Man habe beispielsweise die Wahl, ein Wikipedia mit nur 184'000 Seiten und 90'000 Bildern innert fünf Minuten herunterzuladen. Die kleine Variante «Simple Wikipedia» benötigt nur 200 MB. Mit Bildern benötigt die kleine Variante etwa 30 Minuten.

Java-Anwendung

Die Applikation läuft auf XULRunner, einer Firefox-Laufzeitumgebung; Java kam zur Programmierung zur Anwendung und läuft unter Windows, Linux und OS X.

Autor(in) Simon Gröflin



Kommentare

Es sind keine Kommentare vorhanden.