causy
Wir machen Kausalitätsalgorithmen fassbar.
Welche gesellschaftliche Herausforderung adressiert euer Prototyp?
Kausalitäten statt Korrelationen in Daten zu finden, ist eine schwierige Aufgabe. Die zugrundeliegende Frage ist: Wenn ich einen Faktor verändere, hat das Einfluss auf einen anderen? In manchen Situationen können A/B-Tests durchgeführt werden, z. B. Tests mit Placebo- und Wirkstoff-Tabletten. In anderen Situationen haben wir jedoch nur beobachtete Daten zur Verfügung und können nicht eingreifen: Beispielsweise können wir nicht festlegen, welche Temperatur es an einem bestimmten Ort haben soll oder wir wollen aus ethischen Gründen Nichtraucher*innen nicht dazu bringen, für eine Gesundheitsstudie mit dem Rauchen anzufangen. In solchen Fällen braucht es Kausalitätsalgorithmen, um die Daten bestmöglich zu verstehen. Bisher setzen diese Algorithmen eine ganze Menge an Vorwissen über Statistik voraus. Wir wollen Einstiegshürden in das Thema abbauen, in dem wir Menschen dazu befähigen, Kausalitätsalgorithmen zu verstehen – und wir wollen aufbereiten, wie geprüft werden kann, ob ein Algorithmus auf einen bestimmten Datensatz anwendbar ist.
Wie geht ihr das Problem an?
Wir erstellen eine Python Library, in der wir die gängigen Algorithmen als einfach zusammenfügbare Pipelines implementieren. Dazu werden die Algorithmen in ihre Einzelschritte zerlegt. Interaktive Visualisierungen, Dokumentationen sowie Interpretation der Analyseergebnisse sollen nutzer*innenfreundlich im Browser umgesetzt werden.
An wen richtet sich euer Tool?
Wir richten uns einerseits an Anwender*innen, die mit Daten arbeiten, aber keine Kausalitäts-Expert*innen sind. Das können Forscher*innen oder Datenanalyst*innen aus Unternehmen oder Organisationen sein. Sie können entweder causy direkt nutzen oder die Kausalitätsalgorithmen in ihrem Code weiterverwenden.
causy kann andererseits auch ein Tool für Kausalitätsforscher*innen sein, um schnell neue Ansätze zu testen und Forschungsergebnisse zur Verfügung zu stellen.