How to Translate SQuAD to German? A Comparative Study of Answer Span Retrieval Methods for Question Answering Dataset Creation

1. September 2024

Jens Kaiser and Agnieszka Falenska

In diesem Artikel wird die Wirksamkeit automatischer Span-Retrieval-Methoden zur Übersetzung von SQuAD ins Deutsche anhand einer vergleichenden Analyse zweier Szenarien untersucht. Zunächst gehen wir davon aus, dass keine Goldstandard-Zieldaten vorliegen, und stellen fest, dass TAR, eine Methode, die ein Ausrichtungsmodell verwendet, die höchsten QA-Ergebnisse liefert. Zweitens wechseln wir zu einem Szenario mit kleinen Zieldaten und bewerten die Auswirkungen von Retrieval-Methoden auf fein abgestimmte Modelle. Unsere Ergebnisse zeigen, dass Feinabstimmung zwar im Allgemeinen die Modellleistung verbessert, ihre Wirksamkeit jedoch von der Ausrichtung der Trainings- und Testdatensätze abhängt.

LINK ZU KONVENS 2024

Kontakt

Dr. Agnieszka Faleńska

Zum Seitenanfang