What Can Go Wrong in Authorship Profiling for Demographic Prediction: A Systematic Error Analysis of Model Exclusion

1. September 2023 / IRIS3D

Hongyu Chen

Hongyu Chen wird ihr Poster beim 3. Workshop zur Computerlinguistik für Politik- und Sozialwissenschaften präsentieren.

Authorship Profiling (AP) ist in den letzten Jahren zu einer wichtigen Aufgabe geworden, bei der es darum geht, die demografischen Merkmale eines Autors anhand seines Schreibstils zu ermitteln. Während die Textkategorisierung mithilfe stilometrischer Merkmale bei bestimmten Aufgaben eine hohe Genauigkeit bei der Vorhersage demografischer Merkmale (z. B. Geschlecht und Alter) gezeigt hat, gibt es immer noch Fälle, in denen ML-Modelle und hochmoderne Modelle nicht gut funktionieren. Dies birgt das potenzielle Risiko, bestimmte demografische Gruppen auszugrenzen und falsch darzustellen, was letztendlich zu Vorurteilen und Diskriminierung führt. Um ein umfassendes Verständnis des Ausmaßes zu erlangen, in dem suboptimale Modelle Autoren bestimmter demografischer Gruppen ausschließen könnten, zielt dieser Beitrag darauf ab, durch eine systematische Fehleranalyse Licht auf das Ausschlussverhalten der Modelle bei AP-Aufgaben zu werfen.

LINK ZUR PRÄSENTATION

Kontakt

Hongyu Chen

Zum Seitenanfang