UwaziML
Wir nutzen Machine Learning zum leichteren Erfassen und Navigieren von Textdokumenten.
Welches Problem willst Du mit Deinem Projekt lösen?
Open Data ist ein Grundstein für eine Zivilgesellschaft, die sich unabhängig informieren und aktiv an gesellschaftlichen Entscheidungen beteiligt. Allerdings: Um Wissen aus qualitativen Daten zu gewinnen, braucht es eine detaillierte Analyse der Dokumente. Bisher ist dies mit großem Zeit- und Kostenaufwand verbunden, da die Dokumente per Hand und einzeln bearbeitet werden müssen. Vor allem gemeinnützige Organisationen haben nur begrenzte Mittel um aus der Datenflut, relevante Informationen zu filtern, Erkenntnisse aus verschiedenen Quellen zu verbinden und Muster von Diskriminierung, Korruption oder Ausbeutung zu entdecken, um damit Regierungen und Menschenrechtsverletzer zur Rechenschaft zu ziehen.
Wie löst Dein Projekt das Problem?
Machine Learning und Natural Language Processing eröffnen neue Möglichkeiten um die Analyse von Textdokumenten so effizient und intuitiv wie möglich zu gestalten. Sie geben neue Einblicke in die Daten und unterstützen ihre Analyse durch die automatische Extraktion von Länder, Organisationen und Personen. Für andere Informationen können spezifische Algorithmen trainiert werden. Ziel des Projektes ist diese Methoden in Uwazi, einem open-source Projekt zur kollaborativen Bearbeitung und Veröffentlichung von Dokumentensammlungen, zu integrieren.
An wen richtet sich Dein Tool?
Das Projekt richtet sich in erster Linie an Menschenrechtsorganisationen deren Arbeit auf der Analyse und Veröffentlichung von Dokumentensammlungen basiert. Auch investigative Journalisten oder Initiativen zur Stärkung der Transparenz öffentlicher Einrichtungen profitieren von der automatischen Klassifizierung und Informationsextraktion. Es erleichtert und beschleunigt die Analyse der Dokumente wodurch sich die Organisationen auf ihre Kerntätigkeiten fokussieren können.