In diesem Artikel wird die Wirksamkeit automatischer Span-Retrieval-Methoden zur Übersetzung von SQuAD ins Deutsche anhand einer vergleichenden Analyse zweier Szenarien untersucht. Zunächst gehen wir davon aus, dass keine Goldstandard-Zieldaten vorliegen, und stellen fest, dass TAR, eine Methode, die ein Ausrichtungsmodell verwendet, die höchsten QA-Ergebnisse liefert. Zweitens wechseln wir zu einem Szenario mit kleinen Zieldaten und bewerten die Auswirkungen von Retrieval-Methoden auf fein abgestimmte Modelle. Unsere Ergebnisse zeigen, dass Feinabstimmung zwar im Allgemeinen die Modellleistung verbessert, ihre Wirksamkeit jedoch von der Ausrichtung der Trainings- und Testdatensätze abhängt.
Kontakt |
---|