Domänenspezifische Statistische Maschinelle Übersetzung

Unsere Industriepartner möchten Übersetzungssysteme für spezifische Anwendungsszenarios, haben jedoch nur wenig eigenes Trainingsmaterial zur Verfügung. Deshalb erforschen wir, wie domänenspezifisches Trainingsmaterial optimal für die Statistische Maschinelle Übersetzung (SMT) genutzt werden kann.

Wir verfügen über ein kleines paralleles Korpus (5 Millionen Tokens) von alpinen Texten: Die Publikationsreihen des Schweizer Alpen-Clubs (SAC), die im Projekt Text+Berg digital erfasst wurden.

Projektleitung:

Forschende:

Das Projekt wird vom Schweizerischen Nationalfonds finanziert und läuft seit Anfang 2010.

Weiterführende Informationen: