Projektstatus: Im Einsatz

joureka - Mit mehr Muße vom Interview zum Artikel

Wir erleichtern die Arbeit von Journalist*innen.

Felix Mertineit, Ana-Maria Tomi
#Runde10 #Anwendungen #Journalismus/Medien
Logo_joureka

Welche gesellschaftliche Herausforderung adressiert euer Prototyp?

Um große Datenmengen zu erforschen und zu analysieren, müssen (Daten-)Journalist*innen computergestützte Methoden einsetzen, um Aufgaben zu automatisieren, die sonst extrem zeitaufwändig wären. Auditive Daten, z. B. Interviews oder die Aufzeichnungen von Parlamentssitzungen, sind dabei von zunehmender Relevanz.

Zudem stehen Journalist*innen, die ihre Daten zu ihrer eigenen Sicherheit und der ihrer Quellen schützen wollen, bei der Arbeit mit digitalen Tools vor einer großen Herausforderung. Dank Speech-to-Text-Technologien können die Aufnahmen ausführlich analysiert werden. Allerdings sind die meisten kommerziellen Optionen cloudbasiert, was ein großes Sicherheitsrisiko bedeutet. Vor allem investigativer Journalismus arbeitet mit hochsensiblen Daten und seine Quellen müssen besonders geschützt werden.

joureka stellt sich der Herausforderung, ein Werkzeug bereitzustellen, das die Arbeit von Journalist*innen erleichtert und zeitsparend ist, ohne die Sicherheit der Daten zu gefährden.

Wie geht ihr das Problem an?

Journalist*innen durchsuchen mit joureka ihre Aufnahmen und schreiben auf dieser Basis ihre Artikel. Damit sie die Datenhoheit behalten, arbeitet joureka ausschließlich lokal und mit Verschlüsselung. Aufzeichnungen werden transkribiert und können in Sammlungen organisiert werden. Außerdem können Themen sowie Annotationen visualisiert werden.

joureka wird als Applikation im Docker Container Verbund bereitgestellt. Journalist*innen setzen mittels einer minimal technischen Anleitung eine Instanz auf ihrem Computer auf. Als technische Grundlage dient für das Frontend die JavaScript Bibliothek React. Das Backend wird nach dem Paradigma einer REST API entwickelt und verwendet das Python-Framework FastAPI, die relationale Datenbank PostgreSQL und den Data Lake Service MinIO.

Im Bereich der NLP-Algorithmen wird auf sogenannte Transformer Modelle gesetzt. Bereits trainierte Transformer Modelle werden mittels Transfer Learning und Fine Tuning auf unseren Anwendungsfall optimiert.

An wen richtet sich euer Tool?

joureka ist für deutschsprachige Journalist*innen in Deutschland und im Ausland interessant.