Projektstatus: Im Einsatz

Pamaxie

Wir filtern deinen Content auf anstößige Inhalte.

#Runde11 #API #Sicherheit
pamaxie1024

Welche gesellschaftliche Herausforderung adressiert euer Prototyp?

Wir wollen eine Open-Source-Alternative zu vielen Content-Erkennungssystemen anbieten und damit Benutzer*innen vor bösartigen Dateien, Inhalten für Erwachsenen, Hassreden und  Falschinformationen schützen. Damit erleichtert dieses Projekt es Website- und Anwendungsentwickler*innen, sich auf ihr Hauptgeschäft zu konzentrieren, anstatt ihre eigenen Inhaltserkennungssysteme entwickeln zu müssen. So sparen Entwickler*innen Zeit, Mühe und Geld.

Wie geht ihr das Problem an?

Pamaxie ist eine öffentlich zugängliche, einfach einzurichtende und selbst gehostete API, die sich an Social-Media-Plattformen und Softwarehersteller*innen richtet. Diese bestimmt Dateiinhalte und stellt fest, ob diese für die Endnutzer*innen sicher und angemessen sind. Basierend auf den zurückgelieferten Analyseinformationen kann die Anwender*innen-Software anschließend und anhand von festgelegten Regeln frei bestimmen, was mit dem Inhalt/der Datei passiert. Für die Bilderkennung und den damit zusammenhängenden Content Filter haben wir uns für Machine Learning entschieden, um verschiedene Tags für Bilddateien zu erstellen und folglich zu erkennen. Die Erkennung des Datentyps erfolgt über ‘Magic Numbers’, einer Methode zur Erkennung des Formats durch Analyse der ersten Bits von Binärdaten- und Streams, und wird anschließend im System anonym gespeichert.

Zukünftig soll auch eine Videoerkennung verfügbar sein, wobei eine Kombination aus Keyframes und Frames mit entsprechendem Delta, i.e. einer ausschlaggebenden, relativen  Veränderung der Gewichtung der Verbindungen im neuronalen Netz, via FFmpeg aus Videos extrahiert werden. Danach werden diese Frames durch ein neuronales Netzwerk analysiert, welches, ähnlich dem Verfahren der Bilderkennung, Frametyp, die erkannten Tags sowie sonstige relevante Informationen ausgibt. Eine Besonderheit der Videoerkennung ist dabei, dass analysierte Informationen auch mit einem relativ genauen Zeitstempel angegeben werden können.

An wen richtet sich euer Tool?

Unsere Zielgruppe sind Entwickler*innen von Websites, auf denen Inhalte von Nutzer*innen veröffentlicht oder geteilt werden können. Beispiele sind ein Blog mit Kommentarbereich oder die Dienste von Social Media Plattformen.