Projektstatus: In Arbeit

DDD: Deutsche Dokumente Digitalisieren

Wir machen Dokumente barrierefrei.

Johannes Filter
#Runde7  #Anwendungen  #Journalismus/Medien 

Welche gesellschaftliche Herausforderung adressiert dein Prototyp?

Damit Personen mit Seheinschränkungen mit schriftlichen Dokumenten umgehen können, müssen Informationen und Text extrahiert und für Maschinen lesbar gemacht werden. Gemeinnützige Civic-Tech-Projekte und Privatpersonen haben oft nicht die finanziellen Ressourcen, um funktionale Texterkennungssoftware zu verwenden. DDD bietet eine frei zugängliche Softwarebibliothek an, die es ermöglicht, Informationen aus schriftlichen Dokumenten entgeltfrei bereitzustellen und verarbeitbar zu machen. Gerade für Journalist*innen ist es in der Arbeit mit großen Dokumentensammlungen zudem unerlässlich, diese zu strukturieren – DDD bietet dafür eine automatisierte Auswertung an.

Wie gehst du das Problem an?

DDD extrahiert automatisiert Informationen wie Text und Textart aus gescannten Dokumenten und stellt diese systematisiert und maschinenlesbar zur weiteren Verarbeitung zur Verfügung. Dazu bedient es sich sowohl neuester Verfahren des Maschinellen Sehens als auch der automatisierten Sprachverarbeitung. Es wird ein Softwarepaket zur Verfügung gestellt, auf das Civic-Tech-Projekte aufbauen können, damit die Dokumente für seheingeschränkte Personen barrierefrei werden. Die schlanke Endanwendung wendet sich vor allem an Seheingeschränkte und Journalist*innen.

An wen richtet sich dein Tool?

Die Hauptzielgruppe für das Softwarepaket sind Civic-Tech-Programmierer*innen. Die dazugehörige Endanwendung wendet sich an Seheingeschränkte sowie (Daten-)Journalist*innen, denen sie es ermöglicht, Informationen aus gescannten Bildern oder PDFs zu extrahieren.