Domänenspezifische Statistische Maschinelle Übersetzung

Unsere Industriepartner möchten Übersetzungssysteme für spezifische Anwendungsszenarios, haben jedoch nur wenig eigenes Trainingsmaterial zur Verfügung. Deshalb erforschen wir, wie domänenspezifisches Trainingsmaterial optimal für die Statistische Maschinelle Übersetzung (SMT) genutzt werden kann.

Wir verfügen über ein kleines paralleles Korpus (5 Millionen Tokens) von alpinen Texten: Die Publikationsreihen des Schweizer Alpen-Clubs (SAC), die im Projekt Text+Berg digital erfasst wurden.

Projektleitung:

Martin Volk

Forschende:

Rico Sennrich
Magdalena Plamada (née Jitca)

Das Projekt wird vom Schweizerischen Nationalfonds finanziert und läuft seit Anfang 2010.

Weiterführende Informationen:

Domänenspezifische Statistische Maschinelle Übersetzung

Weiterführende Informationen

Teaser text

Zum UZH Portal

Bereichsnavigation

Hauptnavigation

Domänenspezifische Statistische Maschinelle Übersetzung

Weiterführende Informationen

Title