Projektstatus: Abgeschlossen

Plattform für Transkriptionen

Wir transkribieren Sprachaufnahmen auf unserer Webseite.

Matthias Hannich
#Runde5 #Bildung/Aufklärung #KI/ML

Welches Problem willst du mit deinem Projekt lösen?

Weil manuelle Transkription aufwendig und kostenintensiv ist, haben nicht-kommerzielle Medienproduzent*innen (z.B. freie Radios/Bürgerradios) oder Podcaster*innen selten die Möglichkeit, ihre Aufnahmen mit qualitativ hochwertigen Transkripten zu versehen. Auch innerhalb der Zivilgesellschaft werden unzählige Vorträge, Konferenzen und Info-Veranstaltungen zu gesellschaftlich relevanten Themen aufgezeichnet, können wegen fehlenden Transkripten jedoch nicht als Text durchsucht werden und erzielen deshalb weniger Reichweite. Darüber hinaus haben Menschen mit Hörbeeinträchtigungen zu diesen Aufnahmen kaum Zugang.Es soll eine Plattform zum Transkribieren von Sprachaufnahmen konzipiert und realisiert werden.
Sofern die Lizenz der Aufnahmen es zulässt, werden diese mit den Transkripten so verfügbar gemacht, dass daraus Modelle zur automatischen Spracherkennung erzeugt werden können. Auf der Plattform sollen Menschen ohne Expertenwissen bzw. ohne lange Einarbeitungszeiten gesprochene Sprache kollaborativ transkribieren bzw. Transkripte korrigieren. Der Schwerpunkt ist dabei deutsche Spontansprache.

Wie löst dein Projekt das Problem?

Die Plattform wird als Web-Projekt realisiert – ein aktueller Browser soll die einzige Anforderung zum Beteiligen sein. Zuerst wird ein User Interface programmiert, mit dem einzelne Segmente einer längeren Aufnahme abgespielt und über einen Editor mit Transkripten versehen werden können. Es wird evaluiert, ob oTranscribe (eine freie WebApp zur Transkription für Einzelpersonen) erweitert werden kann, um gleichzeitiges Transkribieren einer Aufnahme durch mehrere Menschen zu ermöglichen, oder ob anhand etablierter Web-Frameworks die Kernfunktionen in einem neuen Tool implementiert werden müssen. Im Anschluss wird das Spracherkennungs-Toolkit Kaldi an die Plattform angebunden, vorhandene (freie) Korpora für Deutsch werden integriert und ein Konzept in Anlehnung an Mozilla Common Voice erarbeitet, um die Transkripte für weiteres Training zu korrigieren bzw. zu normalisieren. Alle Schritte, die zum Aufsetzen und Betrieb der Plattform notwendig sind, werden dokumentiert. Es wird ermöglicht, die Plattform auch als private Instanz zu betreiben und einen geschlossenen Nutzerkreis zum Transkribieren einzuladen.

An wen richtet sich dein Tool?

Die Plattform hilft unterschiedlichen Zielgruppen: Menschen mit Hörbeeinträchtigungen erhalten Zugang zu Sprachaufnahmen, sofern Sprachaufnahmen über/für diese Zielgruppe produziert werden, können diese von Unterstützer*innen transkribiert werden.Vereine und Initiativen, die gesellschaftlich relevante Vorträge oder Diskussionsrunden aufzeichnen bzw. kleine Bibliotheken und Archive können ihr Angebot besser zugänglich und durchsuchbar machen und dadurch die Reichweite ihrer Themen erhöhen. Als primäres Fallbeispiel soll in der Projektphase mit verschiedenen Medienproduzent*innen von coloRadio (Freies Radio aus Dresden) zusammengearbeitet werden.