StoryWeb - Strukturierter Journalismus mit Akteursnetzwerken
Wir machen journalistisches Wissen zum Recherchetool.
Welche gesellschaftliche Herausforderung adressiert euer Prototyp?
Das Projekt soll das Wissensmanagement im Journalismus verbessern. Neben interessierten Bürger*innen finden sich auch viele Gruppen, die Nachrichten aus beruflichem Interesse konsumieren, z. B. Forscher*innen aus Wirtschaft und Wissenschaft und andere Journalist*innen. Sie lesen die Texte vor allem, um bereits aufgedeckte Zusammenhänge nachzuvollziehen. Im investigativen Journalismus geht es dabei häufig um Akteursnetzwerke: Welche Firmen, Verbände und Politiker*innen miteinander in Verbindung stehen, welche Mafia-Strukturen über Ländergrenzen hinweg agieren oder welche Seilschaften und Familienstrukturen die Vergabe von Posten beeinflussen. Der Artikel als Darstellungsform ist dabei eine Hürde: Um lesbar zu bleiben muss der*die Journalist*in die Vorgeschichte und Bezüge zu anderen Texten und Geschichten oft auslassen. Das Projekt eröffnet deshalb einen anderen Zugang. Auf einen Blick sollen die wichtigsten Verbindungen eines*r Akteur*in zu anderen Figuren und Ereignissen zusammengefasst werden, um sowohl den Einstieg als auch die vertiefte Analyse einzelner Zusammenhänge zu erleichtern. Informationen aus relevanten, strukturierten Datenquellen können zusätzlich eingebunden werden und für Spezialist*innen zusätzliche Details liefern. Das Projekt will aus journalistischen Texten strukturierte Akteursnetzwerke extrahieren und diese analysieren. Es soll wesentliche Beziehungen der erwähnten Personen und Organisationen als quantitative Daten nutzbar machen. So können komplexe Geschichten als Datensatz anschlussfähig für zukünftige Recherchen werden.
StoryWeb wird Wissen aus Recherchen systematisch strukturieren und Verbindungen zwischen verschiedenen Geschichten und der Arbeit unterschiedlicher Journalist*innen und Medienhäuser finden.
Wie geht ihr das Problem an?
Zunächst sollen gezielt einzelne Medienangebote ausgesucht werden, deren Berichterstattung zur Extraktion von Akteursnetzwerken geeignet sind. Die Umsetzung soll als Python-Programm erfolgen, welches Artikel von Medienseiten herunterlädt, dann den Artikeltext und Metadaten extrahiert, und durch verschiedene Named Entity Extractors relevante Namen identifiziert. Die genannten Akteur*innen sollen auf der Basis gemeinsamer Nennung mit anderen disambiguiert werden. Durch einfache Analysen sollen im Text außerdem Hinweise auf die Art der Beziehungen unter den identifizierten Akteur*innen erfasst werden. Diese Beziehungen werden schließlich durch manuelles Feedback in ein Kategoriensystem klassifiziert. Eine automatisierte Klassifikation soll so trainiert werden. Im Rahmen des Projektes sollen exemplarisch Akteursnetzwerke zu geeigneten Recherchekomplexen extrahiert, bereinigt und dann auf einer interaktiven Webseite unter detaillierter Nennung von Quellen veröffentlicht werden. Es soll erprobt werden, Beziehungen zwischen Akteur*innen mit bestehenden Wikidata-Items samt Quellenangabe in die Wikidata-Datenbank einzupflegen.
An wen richtet sich euer Tool?
Das Projekt erzeugt Recherche-Material und stellt dieses auf einer interaktiven Webseite dar, die in die Arbeitsabläufe verschiedener Nutzer*innengruppen integriert werden können.
Journalist*innen, die ein systematisches Bild der Arbeit ihrer Kolleg*innen und anderer Medien erhalten und dadurch schneller in Recherchen einsteigen oder Verbindungen zwischen bisher getrennten Stories finden können. Ich kann auf ein berufliches Netzwerk von Journalist*innen zurückgreifen, die das Werkzeug nutzen und Feedback beitragen können. Dazu kommen Dienstleister*innen, etwa in den Bereichen Finanz, Recht, Immobilien oder Kunsthandel, die wissen wollen, ob eine negative Medienberichterstattung zu einem*einer ihrer Kund*innen vorliegt.