Diversity-Aware NLP Intelligent Systems (DANIS)
- Schwerpunkt des Projekts
-
Natural Language Processing (NLP) ist ein Bereich der künstlichen Intelligenz, der es Computern ermöglicht, menschliche Sprache zu verstehen, zu interpretieren und zu generieren. Ein NLP-Intelligentes System ist ein Werkzeug, wie zum Beispiel eine Suchmaschine, ein Sprachassistent oder ein Chatbot, das entwickelt wurde, um Menschen zu unterstützen, indem es ihre Anfragen auf natürliche und scheinbar intelligente Weise verarbeitet und beantwortet.
Die Gruppe für Diversity-Aware NLP Intelligent Systems (DANIS) konzentriert sich darauf, diese Werkzeuge inklusiv und fair zu gestalten. Unsere Hauptmotivation besteht darin, anzuerkennen, dass Menschen aufgrund ihrer Lebenserfahrungen, Kommunikationskontexte oder persönlichen Vorlieben auf unterschiedliche Weise kommunizieren. So können zum Beispiel Einzelpersonen ihre Geschlechtsidentität durch Sprache ausdrücken, Argumente auf eine Weise formulieren, die für sie überzeugend ist, oder in bestimmten Dialekten sprechen. Da Standard-NLP-Systeme oft nicht in der Lage sind, diese sprachlichen Variationen zu erkennen oder zu berücksichtigen, können sie Menschen aus unterrepräsentierten Gruppen oder solche, die nicht standardmäßige sprachliche Ausdrücke verwenden, diskriminieren. DANIS untersucht, wie solche sprachlichen Phänomene rechnerisch modelliert und NLP-Intelligente Systeme entworfen werden können, die alle Benutzer gleich behandeln, unabhängig davon, wie sie kommunizieren.
- Projektdauer
-
Januar 2023 - Dezember 2026
- Kooperation
-
SRF IRIS
- Finanzierung
-
Das Projekt wird vom Ministerium für Wissenschaft, Forschung und Kunst des Landes Baden-Württemberg gefördert.
Veröffentlichungen
2024
- Knuples, Urban, Agnieszka Falenska und Filip Miletić. 2024. Gender Identity in Pretrained Language Models: An Inclusive Approach to Data Creation and Probing. In: Findings of the Association for Computational Linguistics: EMNLP 2024, hg. von Yaser Al-Onaizan, Mohit Bansal, und Yun-Nung Chen, 11612--11631. Findings of the Association for Computational Linguistics: EMNLP 2024. Miami, Florida, USA: Association for Computational Linguistics, November. https://aclanthology.org/2024.findings-emnlp.680.
- Kaiser, Jens und Agnieszka Falenska. 2024. How to Translate SQuAD to German? A Comparative Study of Answer Span Retrieval Methods for Question Answering Dataset Creation. In: Proceedings of the 20th Conference on Natural Language Processing (KONVENS 2024), hg. von Pedro Henrique Luz de Araujo, Andreas Baumann, Dagmar Gromann, Brigitte Krenn, Benjamin Roth, und Michael Wiegand, 134--140. Proceedings of the 20th Conference on Natural Language Processing (KONVENS 2024). Vienna, Austria: Association for Computational Linguistics, September. https://aclanthology.org/2024.konvens-main.15.
- Go, Paul und Agnieszka Falenska. 2024. Is there Gender Bias in Dependency Parsing? Revisiting ``Women’s Syntactic Resilience’’. In: Proceedings of the 5th Workshop on Gender Bias in Natural Language Processing (GeBNLP), hg. von Agnieszka Faleńska, Christine Basta, Marta Costa jussà, Seraphina Goldfarb-Tarrant, und Debora Nozza, 269--279. Proceedings of the 5th Workshop on Gender Bias in Natural Language Processing (GeBNLP). Bangkok, Thailand: Association for Computational Linguistics, August. https://aclanthology.org/2024.gebnlp-1.17.
- Costa jussà, Marta, Pierre Andrews, Christine Basta, Juan Ciro, Agnieszka Falenska, Seraphina Goldfarb-Tarrant, Rafael Mosquera, Debora Nozza und Eduardo Sánchez. 2024. Overview of the Shared Task on Machine Translation Gender Bias Evaluation with Multilingual Holistic Bias. In: Proceedings of the 5th Workshop on Gender Bias in Natural Language Processing (GeBNLP), hg. von Agnieszka Faleńska, Christine Basta, Marta Costa jussà, Seraphina Goldfarb-Tarrant, und Debora Nozza, 399--404. Proceedings of the 5th Workshop on Gender Bias in Natural Language Processing (GeBNLP). Bangkok, Thailand: Association for Computational Linguistics, August. https://aclanthology.org/2024.gebnlp-1.26.
- Dönmez, Esra, Thang Vu und Agnieszka Falenska. 2024. Please note that I’m just an AI: Analysis of Behavior Patterns of LLMs in (Non-)offensive Speech Identification. In: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, hg. von Yaser Al-Onaizan, Mohit Bansal, und Yun-Nung Chen, 18340--18357. Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing. Miami, Florida, USA: Association for Computational Linguistics, November. https://aclanthology.org/2024.emnlp-main.1019.
- Erhard, Lukas, Sara Hanke, Uwe Remer, Agnieszka Falenska und Raphael Heiko Heiberger. 2024. PopBERT. Detecting Populism and Its Host Ideologies in the German Bundestag. Political Analysis. Political Analysis: 1–17--. doi:DOI: 10.1017/pan.2024.12, https://www.cambridge.org/core/article/popbert-detecting-populism-and-its-host-ideologies-in-the-german-bundestag/06C14C50B50D5A7AB45C4A7C8A5AD945.
- Faleńska, Agnieszka, Christine Basta, Marta Costa jussà, Seraphina Goldfarb-Tarrant und Debora Nozza, Hrsg. 2024. Proceedings of the 5th Workshop on Gender Bias in Natural Language Processing (GeBNLP). Bangkok, Thailand: Association for Computational Linguistics. https://aclanthology.org/2024.gebnlp-1.0.
- Falenska, Agnieszka, Eva Maria Vecchi und Gabriella Lapesa. 2024. Self-reported Demographics and Discourse Dynamics in a Persuasive Online Forum. In: Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), hg. von Nicoletta Calzolari, Min-Yen Kan, Veronique Hoste, Alessandro Lenci, Sakriani Sakti, und Nianwen Xue, 14606--14621. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). Torino, Italia: ELRA and ICCL, Mai. https://aclanthology.org/2024.lrec-main.1272.
- Chen, Hongyu, Michael Roth und Agnieszka Falenska. 2024. What Can Go Wrong in Authorship Profiling: Cross-Domain Analysis of Gender and Age Prediction. In: Proceedings of the 5th Workshop on Gender Bias in Natural Language Processing (GeBNLP), hg. von Agnieszka Faleńska, Christine Basta, Marta Costa jussà, Seraphina Goldfarb-Tarrant, und Debora Nozza, 150--166. Proceedings of the 5th Workshop on Gender Bias in Natural Language Processing (GeBNLP). Bangkok, Thailand: Association for Computational Linguistics, August. https://aclanthology.org/2024.gebnlp-1.9.
2023
- Fanton, Nicola, Agnieszka Falenska und Michael Roth. 2023. How-to Guides for Specific Audiences: A Corpus and Initial Findings. In: Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 4: Student Research Workshop), 321--333. Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 4: Student Research Workshop). Toronto, Canada: Association for Computational Linguistics, Juli. doi:10.18653/v1/2023.acl-srw.46, https://aclanthology.org/2023.acl-srw.46.