NAME
App::Greple::xlate - greple 用の翻訳サポートモジュール
SYNOPSIS
greple -Mxlate -e ENGINE --xlate pattern target-file
greple -Mxlate::deepl --xlate pattern target-file
VERSION
Version 0.99
DESCRIPTION
Greple xlateモジュールは目的のテキストブロックを見つけ、翻訳されたテキストに置き換えます。現在、DeepL (deepl.pm) と ChatGPT (gpt3.pm) モジュールがバックエンドエンジンとして実装されています。gpt-4 と gpt-4o も実験的にサポートされています。
PerlのPodスタイルで書かれた文書中の通常のテキストブロックを翻訳したい場合は、xlate::deepl
とperl
モジュールを使って、次のようにgrepleコマンドを使います:
greple -Mxlate::deepl -Mperl --pod --re '^([\w\pP].*\n)+' --all foo.pm
このコマンドのパターン文字列^([ \wpP].*n)+
は、英数字と句読点で始まる連続した行を意味します。このコマンドは、翻訳される領域が強調表示されます。オプション--allはテキスト全体を翻訳するのに使われます。
次に--xlate
オプションを加えて、選択された範囲を翻訳します。そして、必要な部分を見つけて、deeplコマンドの出力で置き換えます。
デフォルトでは、原文と訳文は git(1) と互換性のある "conflict marker" フォーマットで出力されます。ifdef
形式を使えば、unifdef(1)コマンドで簡単に目的の部分を得ることができます。出力形式は--xlate-formatオプションで指定できます。
テキスト全体を翻訳したい場合は、--match-allオプションを使います。これはテキスト全体にマッチするパターン(?s).+
を指定するショートカットです。
sdif
コマンドに-V
オプションを指定すると、コンフリクトマーカー形式のデータを並べて表示することができます。文字列単位で比較するのは意味がないので、--no-cdif
オプションを推奨します。テキストに色をつける必要がない場合は、--no-textcolor
(または--no-tc
)を指定します。
sdif -V --no-tc --no-cdif data_shishin.deepl-EN-US.cm
NORMALIZATION
処理は指定された単位で行われるが、空でないテキストが複数行連続している場合は、それらをまとめて1行に変換します。この処理は次のように行われる:
各行の先頭と末尾の空白を取り除く。
行末が全角句読点の場合は、次の行と連結します。
ある行が全角文字で終わり、次の行が全角文字で始まる場合、その行を連結します。
行末または行頭が全角文字でない場合は、スペース文字を挿入して連結します。
キャッシュデータは正規化されたテキストに基づいて管理されるため、正規化結果に影響を与えない範囲で修正を加えても、キャッシュされた翻訳データは有効です。
この正規化処理は、最初の(0 番目の)偶数パターンに対してのみ行われます。したがって、以下のように2つのパターンを指定した場合、1つ目のパターンにマッチするテキストは正規化処理後に処理され、2つ目のパターンにマッチするテキストには正規化処理は行われないです。
greple -Mxlate -E normalized -E not-normalized
したがって、複数行を1行にまとめて処理するテキストには最初のパターンを使い、整形済みテキストには2番目のパターンを使う。最初のパターンにマッチするテキストがない場合は、(?!)
のように何もマッチしないパターンを使う。
MASKING
時々、翻訳してほしくないテキストの部分があります。例えば、マークダウン・ファイルのタグなどです。DeepL では、このような場合、除外するテキストの部分を XML タグに変換して翻訳し、翻訳完了後に復元することを推奨しています。これをサポートするために、翻訳からマスクする部分を指定できます。
--xlate-setopt maskfile=MASKPATTERN
これはファイル `MASKPATTERN` の各行を正規表現として解釈し、それにマッチする文字列を翻訳し、処理後に元に戻します。#
で始まる行は無視されます。
複雑なパターンは、バックスラッシュとエスケープされた改行で複数行に書くことができます。
マスキングによってテキストがどのように変換されるかは、--xlate-maskオプションで見ることができます。
このインターフェースは実験的なものであり、将来変更される可能性があります。
OPTIONS
- --xlate
- --xlate-color
- --xlate-fold
- --xlate-fold-width=n (Default: 70)
-
マッチした各領域に対して翻訳処理を起動します。
このオプションをつけないと、grepleは通常の検索コマンドとして動作します。したがって、実際の作業を開始する前に、ファイルのどの部分が翻訳の対象となるかをチェックすることができます。
コマンドの結果は標準出力されますので、必要に応じてファイルにリダイレクトするか、App::Greple::updateモジュールの使用を検討してください。
--xlate オプションは --xlate-color オプションを --color=never オプションで呼び出します。
--xlate-fold オプションを指定すると、変換されたテキストは指定した幅で折り返されます。デフォルトの幅は70で、--xlate-fold-widthオプションで設定できます。ランイン操作のために4つのカラムが予約されているので、各行は最大74文字を保持できます。
- --xlate-engine=engine
-
使用する翻訳エンジンを指定します。
-Mxlate::deepl
のようにエンジンモジュールを直接指定する場合は、このオプションを使う必要はありません。現時点では、以下のエンジンが利用可能です。
deepl: DeepL API
gpt3: gpt-3.5-turbo
gpt4: gpt-4-turbo
gpt4o: gpt-4o-mini
gpt-4oのインターフェイスは不安定で、現時点では正しく動作することを保証できません。
- --xlate-labor
- --xlabor
-
翻訳エンジンを呼び出す代わりに、以下の作業を行うことになります。翻訳するテキストを準備すると、クリップボードにコピーされます。フォームに貼り付け、結果をクリップボードにコピーし、returnを押してください。
- --xlate-to (Default:
EN-US
) -
ターゲット言語を指定します。DeepLエンジンを使用している場合は、
deepl languages
コマンドで利用可能な言語を取得できます。 - --xlate-format=format (Default:
conflict
) -
原文と訳文の出力形式を指定します。
xtxt
以外の以下の書式は、翻訳される部分が行の集まりであることを前提としています。実際には、行の一部だけを翻訳することも可能であり、xt
以外の書式を指定しても意味のある結果は得られないです。- conflict, cm
-
原文と訳文はgit(1) conflict marker形式で出力されます。
<<<<<<< ORIGINAL original text ======= translated Japanese text >>>>>>> JA
次のsed(1)コマンドで元のファイルを復元できます。
sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
- colon, :::::::
-
元のテキストと翻訳されたテキストは、マークダウンのカスタム・コンテナ・スタイルで出力されます。
::::::: ORIGINAL original text ::::::: ::::::: JA translated Japanese text :::::::
上記のテキストはHTMLでは以下のように翻訳されます。
<div class="ORIGINAL"> original text </div> <div class="JA"> translated Japanese text </div>
コロンの数はデフォルトでは7です。
::::
のようにコロン列を指定すると、7コロンの代わりにそれが使われます。 - ifdef
-
原文と訳文はcpp(1)
#ifdef
形式で出力されます。#ifdef ORIGINAL original text #endif #ifdef JA translated Japanese text #endif
unifdefコマンドで日本語のテキストだけを取り出すことができます:
unifdef -UORIGINAL -DJA foo.ja.pm
- space
- space+
-
変換前のテキストと変換後のテキストは1行の空白行で区切られて出力されます。
space+
の場合は、変換後のテキストの後に改行も出力されます。 - xtxt
-
形式が
xtxt
(翻訳済みテキスト)または未知の場合は、翻訳済みテキストのみが印刷されます。
- --xlate-maxlen=chars (Default: 0)
-
APIに一度に送信するテキストの最大長を指定します。既定値は、無料のDeepLアカウント・サービスと同様に、API (--xlate) では128K、クリップボード・インタフェース (--xlate-labor) では5000に設定されています。Pro サービスを使用している場合は、これらの値を変更できます。
- --xlate-maxline=n (Default: 0)
-
APIに一度に送信するテキストの最大行数を指定します。
一度に1行ずつ翻訳したい場合は、この値を1に設定します。このオプションは
--xlate-maxlen
オプションより優先されます。 - --[no-]xlate-progress (Default: True)
-
STDERR出力でリアルタイムにトランザクション結果を見ます。
- --xlate-stripe
-
App::Greple::stripeモジュールを使うと、一致した部分をゼブラストライプで表示することができます。これは、マッチした部分が背中合わせに接続されている場合に便利です。
カラーパレットは端末の背景色に応じて切り替わります。明示的に指定したい場合は、 --xlate-stripe-light または --xlate-stripe-dark を使ってください。
- --xlate-mask
-
マスキング機能を実行し、変換されたテキストを復元せずにそのまま表示します。
- --match-all
-
ファイルの全文を対象領域に設定します。
CACHE OPTIONS
xlateモジュールは、各ファイルの翻訳テキストをキャッシュしておき、実行前に読み込むことで、サーバーに問い合わせるオーバーヘッドをなくすことができます。デフォルトのキャッシュ戦略auto
では、対象ファイルに対してキャッシュファイルが存在する場合にのみキャッシュデータを保持します。
--xlate-cache=clearを使用して、キャッシュ管理を開始するか、既存のキャッシュデータをすべてクリーンアップします。このオプションを実行すると、キャッシュファイルが存在しない場合は新しいキャッシュファイルが作成され、その後は自動的にメンテナンスされます。
COMMAND LINE INTERFACE
配布物に含まれている xlate
コマンドを使えば、コマンドラインから簡単にこのモジュールを使うことができます。使い方は xlate
のマニュアルページを参照してください。
xlate
コマンドはDocker環境と協調して動作するため、手元に何もインストールされていなくても、Dockerが利用可能であれば使用することができます。-D
または-C
オプションを使用してください。
また、様々なドキュメントスタイルに対応したmakefileが提供されているので、特別な指定なしに他言語への翻訳が可能です。-M
オプションを使用してください。
Dockerオプションとmakeオプションを組み合わせて、Docker環境でmakeを実行することもできます。
xlate -GC
のように実行すると、現在作業中のgitリポジトリがマウントされたシェルが起動します。
詳しくは"SEE ALSO"セクションの日本語記事を読んでください。
xlate [ options ] -t lang file [ greple options ]
-h help
-v show version
-d debug
-n dry-run
-a use API
-c just check translation area
-r refresh cache
-u force update cache
-s silent mode
-e # translation engine (*deepl, gpt3, gpt4, gpt4o)
-p # pattern to determine translation area
-x # file containing mask patterns
-w # wrap line by # width
-o # output format (*xtxt, cm, ifdef, space, space+, colon)
-f # from lang (ignored)
-t # to lang (required, no default)
-m # max length per API call
-l # show library files (XLATE.mk, xlate.el)
-- end of option
N.B. default is marked as *
Make options
-M run make
-n dry-run
Docker options
-D * run xlate on the container with the same parameters
-C * execute following command on the container, or run shell
-A * attach to the live container
N.B. -D/-C/-A terminates option handling
-G mount git top-level directory
-H mount home directory
-V # specify mount directory
-U do not mount
-R mount read-only
-K do not remove and keep live container
-Q quit and remove live container
-E # specify environment variable to be inherited
-I # docker image or version (default: tecolicom/xlate:version)
Control Files:
*.LANG translation languates
*.FORMAT translation foramt (xtxt, cm, ifdef, colon, space)
*.ENGINE translation engine (deepl, gpt3, gpt4, gpt4o)
EMACS
Emacsエディタからxlate
コマンドを使うには、リポジトリに含まれるxlate.elファイルを読み込みます。xlate-region
関数は指定された領域を翻訳します。デフォルトの言語はEN-US
で、prefix引数で言語を指定できます。
ENVIRONMENT
- DEEPL_AUTH_KEY
-
DeepLサービスの認証キーを設定します。
- OPENAI_API_KEY
-
OpenAIの認証キーです。
INSTALL
CPANMINUS
$ cpanm App::Greple::xlate
TOOLS
DeepLおよびChatGPT用のコマンドラインツールをインストールする必要があります。
https://github.com/DeepLcom/deepl-python
https://github.com/tecolicom/App-gpty
SEE ALSO
App::Greple::xlate とします。
App::Greple::xlate::deepl (英語)
https://hub.docker.com/r/tecolicom/xlate
Dockerコンテナイメージ。
https://github.com/DeepLcom/deepl-python
DeepL Python ライブラリと CLI コマンド。
https://github.com/openai/openai-python
OpenAI Python ライブラリ
https://github.com/tecolicom/App-gpty
OpenAI コマンドラインインタフェース
-
ターゲット・テキスト・パターンの詳細については、greple のマニュアルを参照してください。--inside、--outside、--include、--excludeオプションを使用して、マッチング範囲を制限します。
-
-Mupdate
モジュールを使って、greple コマンドの結果によってファイルを変更することができます。 -
sdifを使うと、-Vオプションでコンフリクトマーカの書式を並べて表示することができます。
-
--xlate-stripeオプションでstripeモジュールを使用します。
ARTICLES
https://qiita.com/kaz-utashiro/items/1c1a51a4591922e18250
DeepL APIで必要な部分だけを翻訳・置換するGrepleモジュール
https://qiita.com/kaz-utashiro/items/a5e19736416ca183ecf6
DeepL APIモジュールによる15言語のドキュメント生成
https://qiita.com/kaz-utashiro/items/1b9e155d6ae0620ab4dd
DeepL APIによる自動翻訳Docker環境
AUTHOR
Kazumasa Utashiro
LICENSE
Copyright © 2023-2024 Kazumasa Utashiro.
This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.