Project status: Im Einsatz

Open Audio Search

Wir machen Speech2Text für viele Nutzer*innen verfügbar.

Sid Moreira da Silva, Franz Heinzmann, Joseline Veit, Henning Schumann
#Round9  #Journalismus/Medien  #KI/ML 

Welche gesellschaftliche Herausforderung adressiert euer Prototyp?

Proprietäre Speech2Text-Angebote sind teuer. Open-Source-Lösungen dafür selbst zu betreiben ist kompliziert und erfordert Know-how, außerdem ist der Zugang dazu zivilgesellschaftlich schwer zu organisieren.

Mit Open Audio Search (OAS) werden nicht nur zivilgesellschaftlich erstellte Inhalte zur Nutzung erschlossen sondern auch KI-Technologien für den Sektor zugänglich gemacht. Die Nutzung bringt wertvolle Erfahrung für die Diskussion um ethische Nutzung von KI und zivilgesellschaftliche Teilhabe am politischen Diskurs. Open-Source-Infrastruktur macht dabei unabhängiger von großen Plattformen und unterstützt damit auch Content- und Datensouveränität.

Wie geht ihr das Problem an?

OAS ist eine Open Source Audiosuchmaschine, die gesprochenes Wort in Text umwandelt und diesen anschließend in einem Suchindex speichert. Damit wird das Verschlagworten und Durchsuchen von Audio- und Videoinhalten und der Betrieb entsprechender Recommender-Systeme vereinfacht.

Audiofiles werden mit Speech2Text in Transkripte umgewandelt. Mithilfe von Natural Language Processing wird Information extrahiert, in einer Suchmaschine indiziert und als Suchergebnis oder Recommendation angezeigt. Die UI zeigt Ergebnisse im Player an der richtigen Stelle an, via API und P2P ist zudem die Anbindung anderer Services an OAS möglich. Fertige Pakete werden, z. B. via Docker, zur einfachen Selbstinstallation bereitgestellt.

An wen richtet sich euer Tool?

Im ersten Schritt richtet sich OAS an gemeinnützige Anbieter:innen deutschsprachiger Audio-/audiovisueller, selbstgehosteter Inhalte. Das sind z. B. Freie Radios im DACH-Raum, individuelle Podcaster, Open GLAM Initiativen, Museen oder Bildungsinitiativen wie Wikimedia.

Gemeinnützige Content-Anbieter:innen können entweder eine eigene Instanz aufsetzen und die Audiosuche selbstgehostet durchführen oder über die OAS-API die OAS-Engine nutzen und die Ergebnisse im eigenen System einbinden.