Connecting BibSonomy with the Internet Archive

Motivation

Am Forschungszentrum L3S wird das Social Bookmarking System BibSonomy entwickelt und betrieben (siehe auch). Es ermöglicht die kollaborative Verwaltung von Web-Lesezeichen und Publikationsmetadaten.

Das Internet Archive hat sich zum Ziel gesetzt, das Internet zu archivieren und Kopien von Webseiten aus vergangenen Zeiten auf in seiner Wayback Machine zur Verfügung zu stellen.

In BibSonomy wurde bereits ein Link integriert, der es ermöglicht mit Hilfe des Memento Time Travel Service automatisch in einem Web-Archiv eine Kopie der gebookmarkten Webseite zu finden, die möglichst nah an dem Zeitpunkt erstellt wurde, an dem auch das Bookmark erstellt wurde.

Ziele

Ziel dieser Arbeit ist die Implementierung eines Frameworks, welches von den Nutzern gespeicherte Web-Links automatisch im Internet Archive abspeichert. Dazu soll die Save Page-Funktion des Internet Archive genutzt werden. Die Herausforderung besteht darin, die richtigen Einträge zum Speichern im Archiv auszuwählen, da nur öffentlich sichtbare Web-Links archiviert werden sollen. Dies umfasst insbesondere den Ausschluss von Einträgen, die kurze Zeit nach dem Speichern durch ein automatisches Klassifikationssystem als Spam erkannt wurden. Diese Zeitverzögerung muss bei der Implementierung z.B. mit Hilfe einer Warteschlange für Einträge beachtet werden.

Wenn Sie Interesse an Web-Technologien, sehr gute Java-Programmierkenntnisse und Erfahrungen mit Spring MVC (oder Interesse, sich diese anzueignen) haben, dann melden Sie sich bei Robert Jäschke.