Gefährdete Gedächtnisse TU Braunschweig entdeckt Sicherheitslücken von Web-Archiven
Webseiten werden im Sekundentakt geändert, gelöscht oder neu strukturiert. Web-Archive speichern Momentaufnahmen dieser Seiten und bewahren somit Teile unseres digitalen Gedächtnisses. Doch wie verlässlich und vertrauenswürdig sind diese Archive? Sind sie tatsächlich ein unverfälschtes und unveränderliches Abbild der Webseiten zu einem früheren Zeitpunkt? Wissenschaftler der Technischen Universität Braunschweig haben die Sicherheit von Web Archiven untersucht und diese dafür gezielt angegriffen.
Im Februar dieses Jahres wurden Tausende Webseiten der US-Regierung offline genommen. So ist beispielsweise die offizielle Hilfeseite der US-Regierung zum Thema Mobbing im Bereich LGBTQ nun gesperrt. Web-Archive sind eine bekannte Lösung gegen dieses Problem. Sie erzeugen sogenannte „Snapshots“, also Momentaufnahmen, einer Webseite zu einem bestimmten Zeitpunkt und helfen uns so, unsere Vergangenheit zu dokumentieren. Die Website zum Mobbing ist über das „Internet Archive“ noch einsehbar. Eine Milliarden Webseiten sind dort inzwischen archiviert.
Verlässliche Quellen
„Web-Archive, wie die Wayback Machine, sind Stützpfeiler für die wahrheitsgetreue Bewahrung von Informationen“, sagt Professor Martin Johns, Leiter des Instituts für Anwendungssicherheit der TU Braunschweig. Forschende nutzen die Archive, um die Entwicklung von JavaScript-Tracking im Verlauf der Zeit zu messen. Richter*innen verewigen Webseiten, die als Beweise in Gerichtsprozessen herangezogen werden. Wikipedia-Editoren berufen sich auf Archive als verlässliche Quellen, und Nutzer*innen können mithilfe der Archive heimliche Änderungen an Online-Artikeln nachvollziehen.
Für alle Nutzenden der Archive ist implizit klar: Mithilfe der Snapshots können die Archive ein „unverfälschtes“ und „unveränderliches“ Abbild der Webseite zu einem früheren Zeitpunkt erzeugen. Doch halten die „Zeitmaschinen“ dieser Erwartung wirklich stand?
Zwei neue Angreifermodelle gegen Web-Archive
Doktorand Robin Kirchner vom Institut für Anwendungssicherheit hat in Kooperation mit Professor Nick Nikiforakis von der Stony Brook University, New York (USA), herausgefunden, dass diese Archive fragiler sind als gedacht.
Die Wissenschaftler entwickelten zwei neue Angreifermodelle und untersuchten, ob acht bekannte Archive diesen Angriffen standhalten. Ihre Ergebnisse haben sie in einem Paper veröffentlicht und auf der Conference on Computer and Communications Security (CCS) in Taiwan präsentiert. „Die von uns aufgedeckten Sicherheitslücken erlauben effektiv, nachträglich archivierte Web-Inhalte zu verfälschen, also über die Vergangenheit zu lügen“, so Professor Johns.
So versucht der von den Wissenschaftlern entwickelte „Evasive Adversary“, seine eigene Webseite vor der Archivierung zu verbergen. Dieser Web-Angreifer kann in Echtzeit erkennen, wenn ein Archiv gerade versucht, seine Webseite zu archivieren. Folglich kann er sich vor den Archiven verbergen oder ihnen gezielt verfälschte Informationen liefern.
Der „Anachronistic Adversary“ wiederum schafft es, die Kontrolle über seine archivierten Webseiten zu behalten und diese jederzeit nachträglich zu verändern. Dabei wird nicht das Archiv selbst angegriffen. Der für den Angriff verantwortliche Code bleibt nach der Archivierung im Snapshot enthalten und lädt beim Aufruf aktuelle Inhalte aus einer vom Angreifer kontrollierten Quelle nach. Dadurch kann der Angreifer den vom Snapshot dargestellten Inhalt nachträglich verändern, ohne den archivierten Snapshot selbst zu modifizieren.
Acht Archive unter der Lupe
Acht bekannte Internetarchive haben die Forschenden untersucht. Darunter befinden sich das bekannteste Archiv, die Wayback Machine, sowie der kostenpflichtige Service der Harvard University, Perma.cc. Darüber hinaus nahmen sie Archive.today, FreezePage, Arquivo, Megalodon, GhostArchive und Conifer unter die Lupe.
Das Ergebnis: Alle Archive sind gegen mindestens eines der beiden Angreifermodelle anfällig. Nach den Beobachtungen der Wissenschaftler konnten sie sich mit ihren Angriffen gezielt vor allen Archiven verbergen. Für Professor Johns noch alarmierender: „Die meisten Archive waren auch gegenüber unseren anachronistischen Angriffen verwundbar. Das bedeutet, dass wir über Web-Angriffe die Archivkopien unserer Webseiten in sieben von acht Archiven nachträglich jederzeit verändern konnten.“
Links:
https://www.nytimes.com/2025/02/02/upshot/trump-government-websites-missing-pages.html, Archive Link: https://archive.ph/mxScx
https://www.stopbullying.gov/bullying/lgbtq
https://web.archive.org/web/20250121064232/https://www.stopbullying.gov/bullying/lgbtq