Annotierung und Alignierung paralleler Korpora zur Untersuchung Linguistischer Variation

In diesem Projekt wollen wir beweisen, dass es nützlich ist, mit annotierten und alignierten parallelen Korpora zu arbeiten, um linguistische Variationen zu untersuchen. Insbesondere interessiert uns der variable Artikel-Gebrauch in den Sprachen Englisch und Deutsch. Die Erkenntnisse können sowohl für den Sprachunterricht als auch für die maschinelle Übersetzung eingesetzt werden.

Annotiert und aligniert werden parallele Texte in den Sprachen Englisch, Deutsch, Französisch, Spanisch, Russisch und Finnisch. Als Quelle dienen uns das Europarl Corpus und das Multilingual United Nations Corpus.

Projektleitung:

Marianne Hundt
Martin Volk

Forschende:

Johannes Graën

Das Projekt wird vom Schweizerischen Nationalfonds finanziert und läuft seit September 2013.

Weiterführende Informationen:

Zusammenfassung: Annotierung und Alignierung paralleler Korpora zur Untersuchung Linguistischer Variation (PDF, 48 KB)

Bereichsnavigation

Hauptnavigation

Annotierung und Alignierung paralleler Korpora zur Untersuchung Linguistischer Variation

Weiterführende Informationen