Annotierung und Alignierung paralleler Korpora zur Untersuchung Linguistischer Variation

In diesem Projekt wollen wir beweisen, dass es nützlich ist, mit annotierten und alignierten parallelen Korpora zu arbeiten, um linguistische Variationen zu untersuchen. Insbesondere interessiert uns der variable Artikel-Gebrauch in den Sprachen Englisch und Deutsch. Die Erkenntnisse können sowohl für den Sprachunterricht als auch für die maschinelle Übersetzung eingesetzt werden.

Annotiert und aligniert werden parallele Texte in den Sprachen Englisch, Deutsch, Französisch, Spanisch, Russisch und Finnisch. Als Quelle dienen uns das Europarl Corpus und das Multilingual United Nations Corpus.

Projektleitung:

Forschende:

Das Projekt wird vom Schweizerischen Nationalfonds finanziert und läuft seit September 2013.

Weiterführende Informationen: