Archivindex Builder
Wir machen vorhandene Web-Archivdaten durchsuchbar.
Welche gesellschaftliche Herausforderung adressiert euer Prototyp?
Das Internet hält eine kaum zu erfassende Vielzahl von Informationen bereit. Historische Informationen werden in unterschiedlichen Web-Archiven wie beispielsweise der Wayback Machine gespeichert. Diese Informationen sind heute kaum für Menschen begreifbar, durchsuchbar oder auswertbar. Das Projekt entwickelt eine Web-Anwendung, die unterschiedliche Datenquellen durchsuchbar macht und somit bei der Recherche zu Zusammenhängen oder öffentlichen Personen hilft. So kann die Zivilgesellschaft bereits vorliegende, aber schwer zugängliche Informationen nutzen, um informiert an demokratischen Prozessen teilzunehmen.
Wie geht ihr das Problem an?
Das Projekt baut auf einer Reihe von Open-Source-Bibliotheken und -Frameworks auf, darunter mehreren, die mit früherer Unterstützung des Prototype Fund entwickelt wurden. Es folgt dem Hassreden-Tracker-Projekt bei der Verwendung des Rocket-Webframeworks für die Programmiersprache Rust, wobei die Webschnittstelle in TypeScript mit React implementiert wird. Die Datenplattform ist ebenfalls in Rust gebaut, und der Index verwendet Tantivy, eine Open-Source-Volltext-Suchmaschinenbibliothek. Auf Webarchiv-Indizes und archivierte Inhalte wird nach Möglichkeit über vorhandene Open-Source-Clients und ansonsten über benutzerdefinierte Clients oder die WebDriver- Browserautomatisierung zugegriffen. Das Projekt unterstützt die Authentifizierung über GitHub, Google und Twitter, entweder über einen Web-Login-Flow oder über die Kommandozeile, sofern bei den Erstnutzenden keine besondere Nachfrage nach anderen Anbietern besteht.
An wen richtet sich euer Tool?
Das Projekt soll in erster Linie die Forschung von Journalist*innen und Interessensgruppen unterstützen, wird aber auch für Aktivist*innen und Akademiker*innen nützlich sein.