audilu - Audio Descriptions made simple
Wir erleichtern das Erstellen von Audiodeskriptionen.
Welche gesellschaftliche Herausforderung adressiert euer Prototyp?
Mit YouTube, Instagram und TikTok sind drei der erfolgreichsten sozialen Netzwerke unserer Zeit rein auf schnelle, visuelle Inhalte ausgelegt. Damit sind sie für die Zielgruppe der blinden und sehbehinderten Nutzer*innen als Informationsquelle nur bedingt geeignet, wodurch deren soziale, kulturelle und politische Teilhabe massiv eingeschränkt wird. Um diesen Missstand zu beheben, benötigt es neben aktivistischer Aufklärung über die Möglichkeiten, diese Barrieren zu reduzieren, auch die richtigen Werkzeuge, um das erworbene Wissen möglichst zielgerichtet und mit wenig Aufwand anzuwenden. Die Anzahl der Bildbeschreibungen in sozialen Netzwerken nimmt stetig zu, und auch Videos werden immer häufiger untertitelt. Der nächste Schritt für mehr Barrierefreiheit und Inklusion von Menschen mit Behinderung im Web stellen auditiv beschriebene Bewegtbilder dar. Deren Erstellung unterstützt „audilu“ mit modernen Technologien, damit am Ende mehr, und vor allem tagesaktuelle Inhalte, zugänglich werden für die eine Audiodeskription bislang aus Kostengründen nicht erwogen werden konnte. Dabei soll der Hauptfokus auf der Effizienz liegen, damit mit möglichst wenig Aufwand die wichtigsten visuellen Inhalte hörbar gemacht werden.
Wie geht ihr das Problem an?
Umgesetzt werden soll „audilu“ als Web-App , damit es auf jenen Geräten lauffähig ist, von denen aus die meisten Medieninhalte erstellt und konsumiert werden – Smartphones. Die vorherrschenden Betriebssysteme iOS und Android bieten beide einige Schnittstellen zur Spracherkennung auf dem Gerät, die den Prozess der Audiodeskription beispielsweise mit Stimmen-Unterscheidung oder Pausen-Erkennung unterstützen können. Ebenfalls bieten beide Systeme eine Vielzahl an hochwertigen Text To Speech-Stimmen an, die sich alternativ zur eigenen Stimme lizenzfrei für Inhalte nutzen lassen. Nutzer*innen können mit der App an passenden Stellen eigene Voice Over-Aufnahmen einsprechen oder Text to Speech verwenden. Sollte eine Aufnahme z.B. unverständlich oder zu lang sein, kann per Spracherkennung automatisch auf Text to Speech gewechselt oder ein Hinweis angezeigt werden, damit die Stelle schnell ausgebessert wird.
An wen richtet sich euer Tool?
Die Zielgruppe des Projektes sind Ersteller*innen von tagesaktuellem Social Media-Content wie beispielsweise die Redaktionen von Lokalzeitungen oder Influencer*innen, deren Inhalte zur Information oder Unterhaltung größerer Zielgruppen dienen.