Параллельный корпус
Параллельный корпус — это набор текстов на языке оригинала и его перевод. Как правило, такие корпусы сделаны только на двух языках. Существуют несколько видов параллельного корпуса:
- однонаправленный (например, английский текст переведенный на русский)
- двунаправленный (например, английский текст переведенный на русский и обратно)
- многонаправленный (английский текст переведенный на русский, немецкий, французский и тд)
Параллельные корпусы служат для того, чтобы увидеть перевод различных языковых структур, фраз и слов в определенном контексте.
Параллельный корпус имеет много общего с памятью переводов, но разница в том, что память переводов не сохраняет оригинальную последовательность текста, тогда как параллельные тексты- сохраняют.
Параллельные корпусы используются:
- в сравнительной лингвистике: для сравнительного анализа структур двух языков;
- в области переводов; для поиска эквивалентов оригинального текста в других языках.
- при обучении движков машинного перевода
- при изучении языка
- при составлении словарей
Примеры корпусов:
- Glosbe: glosbe.com
- Linguee: linguee.ru
- MyMemory: mymemory.translated.net
- Opus: opus.lingfil.uu.se
- Reverso: context.reverso.net
- TAUS Data Cloud: data-app.taus.net
Английский: Parallel corpus
Комментарии