Agnieszka Faleńska wurde eingeladen, am Institut für Informatik der Polnischen Akademie der Wissenschaften einen Grundsatzvortrag zu halten.
Für viele sind Systeme zur Verarbeitung natürlicher Sprache (NLP) zu alltäglichen Notwendigkeiten geworden, mit Anwendungen von der automatischen Dokumentenübersetzung bis hin zu sprachgesteuerten persönlichen Assistenten. In jüngster Zeit hat der zunehmende Einfluss dieser KI-Tools auf das menschliche Leben erhebliche Bedenken hinsichtlich des möglichen Schadens geweckt, den diese Tools anrichten können.
In diesem Vortrag werde ich zunächst einige Beispiele für solche schädlichen Verhaltensweisen zeigen und ihre möglichen Ursprünge diskutieren. Ich werde argumentieren, dass Verzerrungen in NLP-Modellen angegangen werden sollten, indem wir unser Verständnis ihrer sprachlichen Quellen verbessern. Anschließend wird der Vortrag auf drei überzeugende Fallstudien eingehen, die Licht auf Ungleichheiten in häufig verwendeten Trainingsdatenquellen werfen: Wikipedia, Lehrtexte und Diskussionsforen. Anhand dieser Fallstudien werde ich zeigen, dass unabhängig von der Perspektive auf die jeweilige demografische Gruppe (über die gesprochen wird, mit der gesprochen wird und als die gesprochen wird) in all diesen Datensätzen subtile Verzerrungen vorhanden sind und schädliche Ergebnisse von NLP-Modellen aufrechterhalten können.
Kontakt |
---|