OmegaT

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая Alex977 (обсуждение | вклад) в 08:26, 19 января 2019. Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску
OmegaT
Логотип программы OmegaT
Скриншот программы OmegaT
OmegaT 1.6.0 в Windows XP
Тип Автоматизированный перевод, Память переводов
Разработчик Алесь Булойчик (ведущий разработчик)
Написана на Java
Операционная система с поддержкой нужной Java
Первый выпуск 2002
Аппаратная платформа Java Virtual Machine
Последняя версия 3.6.0_10 (16 июля 2018)
Бета-версия 4.1.5_03 (14 ноября 2018)
Репозиторий github.com/omegat-org/om…
Лицензия GPLv3+[1]
Сайт www.omegat.org
Логотип Викисклада Медиафайлы на Викискладе

OmegaT — система автоматизированного перевода, поддерживающая память переводов, написана на языке Java. Возможности продукта включают сегментацию исходного текста на основе регулярных выражений, использование точных (англ. exact) и неточных (англ. fuzzy) соответствий с уже переведёнными фрагментами, использование словарей, поиск контекстов в базах данных переводов и работу с ключевыми словами.

Начиная с версии 2.04 OmegaT также может переводить текущий абзац текста через Google Translate.

Для работы OmegaT требуется версия Java Runtime Environment (JRE) версии 1.8, которая доступна для ОС Linux, Mac OS X и Microsoft Windows, Windows NT. Может работать с OpenJDK.

История и разработка

Разработка OmegaT была начата Китом Годфри (англ. Keith Godfrey). Оригинальный движок был написан в 2000 году на C++. Но релиз, опубликованный в феврале 2001, был написан уже на Java. Начиная с 2002 года разработку и поддержку программы осуществляет сообщество Omegat[2].

Первая Java-версия имела свой собственный формат памяти переводов и требовала для работы Java 1.3. Она поддерживала документы StarOffice, а также тексты в обычной и Unicode-кодировке и HTML. Текст сегментировался на блоки (на практике это обычно означало сегментацию на абзацы). Однако в версии 1.6 было добавлено настраиваемое сегментирование на предложения, что сделало работу с программой значительно удобнее. В качестве формата памяти переводов начиная с версии 1.4b level2 используется стандартный .TMX.

В 2005 году в версии 1.6 появилось сегментирование по предложениям.

В версии 1.8 (2008 год) добавилась проверка орфографии.

Возможность создания плагинов добавлена в 2009 году в версии 2.0[2].

В версиях с 1.4.4 по 1.6.0 главным разработчиком был Максим Михальчук. В версиях до 1.7.1 релиз-менеджером был Генри Пиджферс (Henry Pijffers). В настоящее время ведущим разработчиком является Алесь Булойчик. Менеджер проекта OmegaT — Дидье Бриэль (Didier Briel)[3].

Поддерживаемые форматы

OmegaT поддерживает разнообразные форматы исходных документов.

Непосредственно поддерживаемые форматы

С файлами старых проприетарных форматов Microsoft Office (Word, Excel и PowerPoint) OmegaT не может работать непосредственно, их необходимо перевести в формат OpenDocument (например, с помощью OpenOffice.org) или OOXML с помощью Microsoft Office 2007/2010.

Поддержка XLIFF

Программа Rainbow из фреймворка Okapi может конвертировать некоторые файловые форматы в формат XLIFF, который поддерживает OmegaT.

Также Rainbow может создать для таких документов все каталоги проекта OmegaT, чтобы облегчить их обработку в OmegaT[4].

Поддержка файлов .ttx для Trados®

Используя фильтр Okapi TTX можно обрабатывать файлы .ttx Trados®.

Локализация OmegaT

Пользовательский интерфейс и документация OmegaT переведены на 30 языков.

Переводчики-добровольцы могут перевести пользовательский интерфейс, краткое руководство «Быстрый старт» или всё руководство пользователя (либо все три компонента).

Все языковые файлы и переводы руководства пользователя включены в стандартную поставку OmegaT.

Программное обеспечение, созданное на основе OmegaT

Набор программ для перевода Autshumato

Autshumato состоит из инструмента автоматизированного перевода текста, выравнивателя, PDF-экстрактора, редактора TMX и открытой памяти переводов, основанной на собранных данных

В итоговую версию будут включены менеджер терминологии и машинный переводчик.

Элемент инструмента автоматизированного перевода текста построен на основе OmegaT, для запуска требуется также наличие OpenOffice.org.

Разработка финансируется правительственным Департаментом искусств и культуры Южно-Африканской Республики[5].

Benten

Benten — редактор XLIFF на основе Eclipse.

Использует код OmegaT для обработки процесса нахождения совпадений в памяти переводов.

Частично финансируется правительством Японии[6].

Boltran

Boltran — это автономное веб-приложение для автоматизированного перевода текста, которое имитирует работу с проектом OmegaT.

Создано на основе исходного кода OmegaT, и потому способно переводить всё, что может переводить OmegaT.

Имеет практически идентичные OmegaT управление глоссарием и возможности по нечёткому совпадению.

В настоящее время доступен только сервер Boltran на веб-сайте разработчиков. Однако в теории любой желающий может настроить открытый или закрытый сервер Boltran[7].

OmegaT+

OmegaT+ — система автоматизированного перевода, которая является ответвлением OmegaT версии 1.4.5 в 2005 году. Принцип работы такой же, что и в OmegaT. Имеются свои возможности, но проекты не совместимы с OmegaT[8].

См. также

Примечания

  1. http://omegat.sourceforge.net/manual-standard/en/appendix.legal.notices.html - Приложение 1 к документации
  2. 1 2 Dublin Computational Linguistic Research Seminars Didier Briel (June 2012)
  3. О проекте
  4. Okapi Framework – Утилита извлечения текста может создать дерево каталогов проекта OmegaT
  5. Autshumato
  6. Benten
  7. Boltran
  8. OmegaT+

Ссылки