Die meisten Internetseiten sterben irgendwann. Wenn man Glück hat, waren sie beliebt genug, um durch einen riesigen Crawler aufgenommen und archiviert zu werden.

Das Internet Archive ist wohl die größte Initiative gegen Link Rot. Es ist öffentlich und wird hoffentlich auch in den kommenden Jahren existieren. Andererseits speichert es aber auch jede Menge Müll, kann dafür aber auch aus urheberrechtlichen Gründen nicht alles aufnehmen. Vor allem die unbeleuchteten, aber dafür umso wertvolleren Ecken von privaten Blogs bis hin zu akademischen Projektseiten werden oft übersehen. Zudem ist das Internet Archive nicht unabhängig. Oder “frei” im Sinne von FOSS.

bookmark-managers wie Raindrop sind auch nicht “für immer”. Existiert die Plattform nicht mehr, gehen auch die gespeicherten Inhalte verloren. Pro-Versionen hin oder her. So auch Read-it-later-Services wie Pocket und Instapaper.

Wem kann ich denn außerdem meine Daten anvertrauen? Werden aus meinen gespeicherten Inhalten Informationen über mich als Kunden extrahiert? Woher soll ich wissen, ob die Firmen irgendeine Backup-Strategie haben? Schauen wir mal, was es sonst noch so gibt…

Wallabag ist zwar nur für Artikel gedacht, lässt sich aber zumindest self-hosten.

Irchiver speichert automatisiert und regelmäßig Screenshots und Plaintext. ArchiveBox speichert Snapshots, aber immer nur nach manuellem “Ja, das will ich”. Nope, Korrektur: ArchiveBox kann automatische, geplante Snapshots aus Textdateien oder sogar von Pocket-HTML-Exporten und vielen anderen Formaten.

ipwb: InterPlanetary Wayback indiziert WARC-Dateien und bereitet sie auf als P2P Dateisystem.

Side note: Papier ist haltbarer als jede elektronische Speichermethode. Bücher und andere Manuskripte zu sammeln ist immer noch eine fantastische Idee. Siehe auch The Antilibrary.