NAME
App::Greple::xlate - модуль поддержки перевода для greple
SYNOPSIS
greple -Mxlate -e ENGINE --xlate pattern target-file
greple -Mxlate::deepl --xlate pattern target-file
VERSION
Version 0.99
DESCRIPTION
Модуль xlate Greple находит желаемые текстовые блоки и заменяет их переведенным текстом. В настоящее время в качестве движка используются модули DeepL (deepl.pm) и ChatGPT (gpt3.pm). Также включена экспериментальная поддержка для gpt-4 и gpt-4o.
Если вы хотите перевести обычные текстовые блоки в документе, написанном в стиле Perl's pod, используйте команду greple с модулем xlate::deepl
и perl
следующим образом:
greple -Mxlate::deepl -Mperl --pod --re '^([\w\pP].*\n)+' --all foo.pm
В этой команде строка шаблона ^([\w\pP].*\n)+
означает последовательные строки, начинающиеся с буквенно-цифровой и знаковой буквы. Эта команда показывает область, которую нужно перевести, выделенную. Опция --all используется для вывода всего текста.
Затем добавьте опцию --xlate
, чтобы перевести выбранную область. Затем он найдет нужные разделы и заменит их выводом команды deepl.
По умолчанию оригинальный и переведенный текст выводится в формате "конфликтного маркера", совместимого с git(1). Используя формат ifdef
, вы можете легко получить нужную часть с помощью команды unifdef(1). Формат вывода можно указать с помощью опции --xlate-format.
Если вы хотите перевести весь текст, используйте опцию --match-all. Это сокращение для указания шаблона (?s).+
, который соответствует всему тексту.
Формат данных маркера конфликта можно просмотреть в стиле "рядом" с помощью команды sdif
с опцией -V
. Поскольку сравнивать строки по отдельности не имеет смысла, рекомендуется использовать опцию --no-cdif
. Если вам не нужно раскрашивать текст, укажите --no-textcolor
(или --no-tc
).
sdif -V --no-tc --no-cdif data_shishin.deepl-EN-US.cm
NORMALIZATION
Обработка выполняется в указанных единицах, но в случае последовательности нескольких строк непустого текста они объединяются вместе в одну строку. Эта операция выполняется следующим образом:
Удалить пробелы в начале и в конце каждой строки.
Если строка заканчивается символом пунктуации полной ширины, объедините ее с следующей строкой.
Если строка заканчивается полноширинным символом, а следующая строка начинается с полноширинного символа, объединить строки.
Если конец или начало строки не является полноширинным символом, объединить их, вставив пробел.
Данные кэша управляются на основе нормализованного текста, поэтому даже если вносятся изменения, не влияющие на результаты нормализации, кэшированные данные перевода останутся действительными.
Этот процесс нормализации выполняется только для первого (0-го) и четных шаблонов. Таким образом, если два шаблона указаны следующим образом, текст, соответствующий первому шаблону, будет обработан после нормализации, и никакой процесс нормализации не будет выполнен для текста, соответствующего второму шаблону.
greple -Mxlate -E normalized -E not-normalized
Следовательно, используйте первый шаблон для текста, который должен быть обработан путем объединения нескольких строк в одну строку, и используйте второй шаблон для предварительно отформатированного текста. Если в первом шаблоне нет текста для сопоставления, используйте шаблон, который ничего не сопоставляет, например, (?!)
.
MASKING
Иногда бывают части текста, которые вы не хотите переводить. Например, теги в файлах разметки. DeepL предлагает, что в таких случаях часть текста, которую нужно исключить, должна быть преобразована в XML-теги, переведена, а затем восстановлена после завершения перевода. Для поддержки этого можно указать части, которые нужно скрыть от перевода.
--xlate-setopt maskfile=MASKPATTERN
Это будет интерпретировать каждую строку файла `MASKPATTERN` как регулярное выражение, переводить строки, соответствующие ему, и возвращать после обработки. Строки, начинающиеся с #
, игнорируются.
Сложный шаблон можно написать на нескольких строках с использованием символа обратного слеша для переноса строки.
Как текст преобразуется с помощью маскировки, можно увидеть с помощью опции --xlate-mask.
Этот интерфейс является экспериментальным и может быть изменен в будущем.
OPTIONS
- --xlate
- --xlate-color
- --xlate-fold
- --xlate-fold-width=n (Default: 70)
-
Вызывайте процесс перевода для каждой совпавшей области.
Без этой опции greple ведет себя как обычная команда поиска. Таким образом, вы можете проверить, какая часть файла будет подвергаться переводу, прежде чем вызывать фактическую работу.
Результат команды выводится в стандартный вывод, поэтому, при необходимости, перенаправьте его в файл или рассмотрите использование модуля App::Greple::update.
Опция --xlate вызывает опцию --xlate-color с опцией --color=never.
С опцией --xlate-fold преобразованный текст складывается с указанной шириной. Ширина по умолчанию - 70 и может быть установлена с помощью опции --xlate-fold-width. Четыре столбца зарезервированы для операции run-in, поэтому каждая строка может содержать не более 74 символов.
- --xlate-engine=engine
-
Указывает используемый движок перевода. Если вы указываете модуль движка напрямую, например,
-Mxlate::deepl
, вам не нужно использовать эту опцию.На данный момент доступны следующие движки:
deepl: DeepL API
gpt3: gpt-3.5-turbo
gpt4: gpt-4-turbo
gpt4o: gpt-4o-mini
Интерфейс gpt-4o нестабилен и не гарантируется корректная работа в данный момент.
- --xlate-labor
- --xlabor
-
Вместо вызова движка перевода, от вас ожидается выполнение работы. После подготовки текста для перевода, он копируется в буфер обмена. Ожидается, что вы вставите его в форму, скопируете результат в буфер обмена и нажмете Enter.
- --xlate-to (Default:
EN-US
) -
Укажите целевой язык. Вы можете получить доступные языки с помощью команды
deepl languages
, когда используется движок DeepL. - --xlate-format=format (Default:
conflict
) -
Укажите формат вывода для оригинального и переведенного текста.
Следующие форматы, отличные от
xtxt
, предполагают, что часть, которую нужно перевести, представляет собой набор строк. Фактически, можно перевести только часть строки, и указание формата, отличного отxtxt
, не приведет к осмысленным результатам.- conflict, cm
-
Оригинальный и преобразованный тексты печатаются в формате маркера конфликта git(1).
<<<<<<< ORIGINAL original text ======= translated Japanese text >>>>>>> JA
Вы можете восстановить исходный файл с помощью следующей команды sed(1).
sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
- colon, :::::::
-
```html
::::::: ORIGINAL original text ::::::: ::::::: JA translated Japanese text :::::::
<div style="background-color: #f4f4f4; color: #333; border: 1px solid #ccc; border-radius: 5px; padding: 10px;">
<div class="ORIGINAL"> original text </div> <div class="JA"> translated Japanese text </div>
По умолчанию количество двоеточий равно 7. Если вы укажете последовательность двоеточий, например
:::::
, она будет использоваться вместо 7 двоеточий. - ifdef
-
Оригинальный и преобразованный тексты печатаются в формате cpp(1)
#ifdef
.#ifdef ORIGINAL original text #endif #ifdef JA translated Japanese text #endif
Вы можете получить только японский текст с помощью команды unifdef:
unifdef -UORIGINAL -DJA foo.ja.pm
- space
- space+
-
Original text:
- xtxt
-
Если формат -
xtxt
(переведенный текст) или неизвестный, будет выведен только переведенный текст.
- --xlate-maxlen=chars (Default: 0)
-
Переведите следующий текст на русский язык, построчно.
- --xlate-maxline=n (Default: 0)
-
Укажите максимальное количество строк текста, отправляемых в API за один раз.
Установите это значение равным 1, если хотите переводить по одной строке за раз. Этот параметр имеет приоритет над опцией
--xlate-maxlen
. - --[no-]xlate-progress (Default: True)
-
Смотрите результат перевода в реальном времени в выводе STDERR.
- --xlate-stripe
-
Используйте модуль App::Greple::stripe, чтобы показать совпадающую часть в стиле зебры. Это полезно, когда совпадающие части соединены друг с другом.
Палитра цветов меняется в зависимости от цвета фона терминала. Если вы хотите явно указать, вы можете использовать --xlate-stripe-light или --xlate-stripe-dark.
- --xlate-mask
-
Выполните функцию маскировки и отобразите преобразованный текст без восстановления.
- --match-all
-
Установите весь текст файла в качестве целевой области.
CACHE OPTIONS
Модуль xlate может хранить кэшированный текст перевода для каждого файла и считывать его перед выполнением, чтобы устранить накладные расходы на запросы к серверу. Стратегия кэширования по умолчанию auto
поддерживает кэширование данных только при наличии файла кэша для целевого файла.
Используйте --xlate-cache=clear, чтобы инициировать управление кэшем или очистить все существующие кэшированные данные. После выполнения с этой опцией будет создан новый файл кэша, если его нет, и затем он будет автоматически поддерживаться.
- --xlate-cache=strategy
-
auto
(Default)-
Поддерживайте файл кэша, если он существует.
create
-
Создайте пустой файл кэша и выйдите.
always
,yes
,1
-
Поддерживайте кэш в любом случае, если цель - обычный файл.
clear
-
Сначала очистите данные кэша.
never
,no
,0
-
Никогда не используйте файл кэша, даже если он существует.
accumulate
-
По умолчанию неиспользуемые данные удаляются из файла кэша. Если вы не хотите удалять их и хранить в файле, используйте
accumulate
.
- --xlate-update
-
Эта опция заставляет обновить файл кэша даже в том случае, если это необходимо.
COMMAND LINE INTERFACE
Вы можете легко использовать этот модуль из командной строки, используя команду xlate
, включенную в дистрибутив. Смотрите страницу руководства xlate
для примеров использования.
Команда xlate
работает вместе с средой Docker, поэтому вы можете использовать ее, даже если у вас ничего не установлено на руках, при условии наличия Docker. Используйте опцию -D
или -C
.
Также, поскольку предоставляются make-файлы для различных стилей документов, перевод на другие языки возможен без особых указаний. Используйте опцию -M
.
Вы также можете комбинировать опции Docker и make, чтобы запустить make в среде Docker.
Запуск, например, как xlate -GC
, запустит оболочку с текущим рабочим репозиторием git.
Прочтите японскую статью в разделе "СМОТРИТЕ ТАКЖЕ" для получения подробной информации.
xlate [ options ] -t lang file [ greple options ]
-h help
-v show version
-d debug
-n dry-run
-a use API
-c just check translation area
-r refresh cache
-u force update cache
-s silent mode
-e # translation engine (*deepl, gpt3, gpt4, gpt4o)
-p # pattern to determine translation area
-x # file containing mask patterns
-w # wrap line by # width
-o # output format (*xtxt, cm, ifdef, space, space+, colon)
-f # from lang (ignored)
-t # to lang (required, no default)
-m # max length per API call
-l # show library files (XLATE.mk, xlate.el)
-- end of option
N.B. default is marked as *
Make options
-M run make
-n dry-run
Docker options
-D * run xlate on the container with the same parameters
-C * execute following command on the container, or run shell
-A * attach to the live container
N.B. -D/-C/-A terminates option handling
-G mount git top-level directory
-H mount home directory
-V # specify mount directory
-U do not mount
-R mount read-only
-K do not remove and keep live container
-Q quit and remove live container
-E # specify environment variable to be inherited
-I # docker image or version (default: tecolicom/xlate:version)
Control Files:
*.LANG translation languates
*.FORMAT translation foramt (xtxt, cm, ifdef, colon, space)
*.ENGINE translation engine (deepl, gpt3, gpt4, gpt4o)
EMACS
Загрузите файл xlate.el, включенный в репозиторий, чтобы использовать команду xlate
из редактора Emacs. Функция xlate-region
переводит указанную область. Язык по умолчанию - EN-US
, и вы можете указать язык, вызывая его с аргументом-префиксом.
ENVIRONMENT
- DEEPL_AUTH_KEY
-
Установите ваш ключ аутентификации для сервиса DeepL.
- OPENAI_API_KEY
-
Ключ аутентификации OpenAI.
INSTALL
CPANMINUS
$ cpanm App::Greple::xlate
TOOLS
Необходимо установить командные инструменты для DeepL и ChatGPT.
https://github.com/DeepLcom/deepl-python
https://github.com/tecolicom/App-gpty
SEE ALSO
https://hub.docker.com/r/tecolicom/xlate
Образ контейнера Docker.
https://github.com/DeepLcom/deepl-python
Библиотека DeepL для Python и командная строка.
https://github.com/openai/openai-python
Библиотека OpenAI для Python
https://github.com/tecolicom/App-gpty
Командный интерфейс OpenAI
-
См. руководство по greple для получения подробной информации о шаблоне целевого текста. Используйте опции --inside, --outside, --include, --exclude, чтобы ограничить область совпадения.
-
Вы можете использовать модуль
-Mupdate
, чтобы изменять файлы на основе результата команды greple. -
Используйте sdif, чтобы показать формат маркера конфликта рядом с опцией -V.
-
Модуль Greple stripe используется с помощью опции --xlate-stripe.
ARTICLES
https://qiita.com/kaz-utashiro/items/1c1a51a4591922e18250
Модуль Greple для перевода и замены только необходимых частей с использованием API DeepL (на японском)
https://qiita.com/kaz-utashiro/items/a5e19736416ca183ecf6
Генерация документов на 15 языках с помощью модуля DeepL API (на японском)
https://qiita.com/kaz-utashiro/items/1b9e155d6ae0620ab4dd
Автоматическая среда Docker для перевода с использованием API DeepL (на японском)
AUTHOR
Kazumasa Utashiro
LICENSE
Copyright © 2023-2024 Kazumasa Utashiro.
This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.