Параллельный корпус

Параллельный корпус — это набор текстов на языке оригинала и его перевод. Как правило, такие корпусы сделаны только на двух языках. Существуют несколько видов параллельного корпуса:

  • однонаправленный (например, английский текст переведенный на русский)
  • двунаправленный (например, английский текст переведенный на русский и обратно)
  • многонаправленный (английский текст переведенный на русский, немецкий, французский и тд)

Параллельные корпусы служат для того, чтобы увидеть перевод различных языковых структур, фраз и слов в определенном контексте.

Параллельный корпус имеет много общего с памятью переводов, но разница в том, что память переводов не сохраняет оригинальную последовательность текста, тогда как параллельные тексты- сохраняют.

Параллельные корпусы используются:

  • в сравнительной лингвистике: для сравнительного анализа структур двух языков;
  • в области переводов; для поиска эквивалентов оригинального текста в других языках.
  • при обучении движков машинного перевода
  • при изучении языка
  • при составлении словарей

Примеры корпусов:


Английский: Parallel corpus

Добавить комментарий