Projektstatus: Im Einsatz

SemanticDocuments

Wir geben Dokumenten Kontext.

Niclas Schmidt, Michael Volz
#Runde15 #Anwendungen #Diversität/Inklusion

Welche gesellschaftliche Herausforderung adressiert euer Prototyp?

Viele Abläufe in unserer Gesellschaft basieren auf dem Austausch und der Bearbeitung von Dokumenten und nicht von Informationen. Auch im digitalen Raum wird oft nur mit gescannten Dokumenten ohne strukturierte Informationen gearbeitet. Dabei entsteht bei allen Beteiligten erheblicher Mehraufwand, weil Aufgaben bewältigt werden müssen, die unter anderen Umständen automatisierbar wären: Klassifikation und Sortierung von Dokumenten, Identifikation von Metadaten, Extraktion tabulärer Daten usw. Semantic Documents soll Individuen und Organisationen helfen, Abläufe zu verbessern und Automatisierungspotenzial zu nutzen. Besonders Menschen, die auf Assistenztechnologien wir Screenreader angewiesen sind, profitieren.

Wie geht ihr das Problem an?

Für die semantische Erkennung nutzen wir eine Kombination vorhandener Open-Source-Software. Für das Vorverarbeiten von gescannten Dokumenten kommt unpaper zum Einsatz. Anschließend werden Dokumente durch eine Pipeline geschickt: Um die Struktur des Layouts zu erkennen nutzen wir LayoutParser, um das Dokument zu klassifizieren doc2data und eigene Klassifizierer und schließlich tesseract, ocermypdf, parsr, pd3f, camelot, flair und ähnliche Software, um einzelne Layout-Elemente zu analysieren sowie die semantischen Informationen zu extrahieren.

Die primäre Ausgabe-Methode ist ein um die strukturierten Daten ergänztes PDF-Dokument. Die erkannten Rohdaten werden als json-Anhang in der Ausgabedatei gespeichert und stehen so anderer Software zur Verfügung, beispielsweise für eine automatisierte Weiterverarbeitung. Zusätzlich wird erstellte Datei nach dem PDF/UA-Standard getagt sein, sodass die logische Dokumentenstruktur für Assistenzsoftware bereit steht.

An wen richtet sich euer Tool?

Wir richten uns an Alle, die im beruflichen, institutionellen oder privaten Kontext Dokumentenverarbeitung zugänglicher und effizienter gestalten möchten. Einen besonderen Fokus legen wir dabei auf Menschen mit Seheinschränkungen oder dem Bedarf nach Komplexitätsreduktion.