NAME

App::Greple::xlate - modul de suport pentru traducere pentru greple

SYNOPSIS

greple -Mxlate -e ENGINE --xlate pattern target-file

greple -Mxlate::deepl --xlate pattern target-file

VERSION

Version 0.37

DESCRIPTION

Modulul Greple xlate găsește blocurile de text dorite și le înlocuiește cu textul tradus. În prezent, modulul DeepL (deepl.pm) și ChatGPT (gpt3.pm) sunt implementate ca motoare de bază. Suportul experimental pentru gpt-4 și gpt-4o este, de asemenea, inclus.

Dacă doriți să traduceți blocurile de text normale dintr-un document scris în stilul pod al Perl, utilizați comanda greple cu modulul xlate::deepl și perl în felul următor:

greple -Mxlate::deepl -Mperl --pod --re '^(\w.*\n)+' --all foo.pm

În această comandă, șirul de tipar ^(\w.*\n)+ înseamnă linii consecutive care încep cu litere alfanumerice. Această comandă arată zona care urmează să fie tradusă evidențiată. Opțiunea --all este utilizată pentru a produce întregul text.

Apoi adăugați opțiunea --xlate pentru a traduce zona selectată. Apoi, va găsi secțiunile dorite și le va înlocui cu rezultatul comenzii deepl.

În mod implicit, textul original și textul tradus sunt afișate în formatul "conflict marker", compatibil cu git(1). Utilizând formatul ifdef, puteți obține partea dorită cu ușurință folosind comanda unifdef(1). Formatul de ieșire poate fi specificat prin opțiunea --xlate-format.

Dacă doriți să traduceți întregul text, utilizați opțiunea --match-all. Aceasta este o scurtătură pentru a specifica modelul (?s).+ care se potrivește cu întregul text.

Formatul datelor pentru markerul de conflict poate fi vizualizat în stil side-by-side folosind comanda sdif cu opțiunea -V. Deoarece nu are sens să comparăm pe baza fiecărui șir de caractere, se recomandă opțiunea --no-cdif. Dacă nu aveți nevoie să colorați textul, specificați --no-textcolor (sau --no-tc).

sdif -V --no-tc --no-cdif data_shishin.deepl-EN-US.cm

NORMALIZATION

Procesarea se face în unități specificate, dar în cazul unei secvențe de mai multe linii de text ne-gol, acestea sunt convertite împreună într-o singură linie. Această operație se efectuează astfel:

  • Se elimină spațiile albe de la început și sfârșitul fiecărei linii.

  • Dacă o linie se încheie cu un caracter de punctuație de lățime completă, concatenează cu linia următoare.

  • Dacă o linie se termină cu un caracter de lățime completă și linia următoare începe cu un caracter de lățime completă, se concatenează liniile.

  • Dacă fie sfârșitul sau începutul unei linii nu este un caracter de lățime completă, acestea sunt concatenate prin inserarea unui caracter spațiu.

Datele cache sunt gestionate pe baza textului normalizat, astfel încât chiar dacă se fac modificări care nu afectează rezultatele normalizării, datele de traducere cache vor fi în continuare eficiente.

Acest proces de normalizare este efectuat doar pentru primul (0-lea) și pentru modelul cu număr par. Prin urmare, dacă sunt specificate două modele după cum urmează, textul care se potrivește cu primul model va fi procesat după normalizare, iar niciun proces de normalizare nu va fi efectuat pe textul care se potrivește cu al doilea model.

greple -Mxlate -E normalized -E not-normalized

Prin urmare, folosiți primul model pentru textul care trebuie procesat prin combinarea mai multor linii într-o singură linie, și folosiți al doilea model pentru textul pre-formatat. Dacă nu există text de potrivit în primul model, atunci folosiți un model care nu se potrivește cu nimic, cum ar fi (?!).

MASKING

Uneori, există părți ale textului pe care nu dorești să le traduci. De exemplu, tag-urile din fișierele markdown. DeepL sugerează că în astfel de cazuri, partea de text de exclus să fie convertită în tag-uri XML, tradusă, și apoi restaurată după ce traducerea este completă. Pentru a susține acest lucru, este posibil să specifici părțile care trebuie mascate de la traducere.

--xlate-setopt maskfile=MASKPATTERN

Acesta va interpreta fiecare linie a fișierului `MASKPATTERN` ca o expresie regulată, va traduce șirurile care se potrivesc cu ea, și va reveni la forma inițială după procesare. Liniile care încep cu # sunt ignorate.

Această interfață este experimentală și este supusă unor posibile schimbări în viitor.

OPTIONS

--xlate
--xlate-color
--xlate-fold
--xlate-fold-width=n (Default: 70)

Invocați procesul de traducere pentru fiecare zonă potrivită.

Fără această opțiune, greple se comportă ca o comandă de căutare normală. Deci puteți verifica care parte a fișierului va fi supusă traducerii înainte de a invoca lucrul efectiv.

Rezultatul comenzii este trimis la ieșirea standard, deci redirecționați-l într-un fișier dacă este necesar sau luați în considerare utilizarea modulului App::Greple::update.

Opțiunea --xlate apelează opțiunea --xlate-color cu opțiunea --color=never.

Cu opțiunea --xlate-fold, textul convertit este pliat în funcție de lățimea specificată. Lățimea implicită este de 70 și poate fi setată prin opțiunea --xlate-fold-width. Patru coloane sunt rezervate pentru operația run-in, astfel încât fiecare linie poate conține cel mult 74 de caractere.

--xlate-engine=engine

Specifică motorul de traducere care trebuie utilizat. Dacă specifici direct modulul motorului, cum ar fi -Mxlate::deepl, nu este nevoie să folosești această opțiune.

În acest moment, următoarele motoare sunt disponibile

  • deepl: DeepL API

  • gpt3: gpt-3.5-turbo

  • gpt4: gpt-4-turbo

  • gpt4o: gpt-4o-mini

    Interfața lui gpt-4o este instabilă și nu poate fi garantată că funcționează corect în acest moment.

--xlate-labor
--xlabor

În loc să apelați motorul de traducere, se așteaptă să lucrați pentru el. După ce ați pregătit textul pentru a fi tradus, acesta este copiat în clipboard. Se așteaptă să îl lipiți în formular, să copiați rezultatul în clipboard și să apăsați Enter.

--xlate-to (Default: EN-US)

Specificați limba țintă. Puteți obține limbile disponibile prin comanda deepl languages atunci când utilizați motorul DeepL.

--xlate-format=format (Default: conflict)

Specificați formatul de ieșire pentru textul original și cel tradus.

Formatele următoare, în afara xtxt, presupun că partea de tradus este o colecție de linii. De fapt, este posibil să traduci doar o porțiune dintr-o linie, iar specificarea unui format diferit de xtxt nu va produce rezultate semnificative.

conflict, cm

Textul original și cel convertit sunt tipărite în formatul de marcare a conflictelor git(1).

<<<<<<< ORIGINAL
original text
=======
translated Japanese text
>>>>>>> JA

Puteți recupera fișierul original cu următoarea comandă sed(1).

sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
colon, :::::::

Textul original și cel convertit sunt tipărite în notația stilului bloc div git(1) markdown.

::::::: ORIGINAL
original text
:::::::
::::::: JA
translated Japanese text
:::::::

Asta înseamnă:

<div class="ORIGINAL">
original text
</div>
<div class="JA">
translated Japanese text
</div>

Numărul de două puncte este 7 în mod implicit. Dacă specifici o secvență de două puncte ca :::::, aceasta este folosită în loc de 7 două puncte.

ifdef

Textul original și cel convertit sunt tipărite în formatul cpp(1) #ifdef.

#ifdef ORIGINAL
original text
#endif
#ifdef JA
translated Japanese text
#endif

Puteți recupera doar textul japonez cu comanda unifdef:

unifdef -UORIGINAL -DJA foo.ja.pm
space
space+

Original text:

xtxt

Dacă formatul este xtxt (text tradus) sau necunoscut, se tipărește doar textul tradus.

--xlate-maxlen=chars (Default: 0)

Traduceți următorul text în limba română, linie cu linie.

--xlate-maxline=n (Default: 0)

Specifică numărul maxim de linii de text care vor fi trimise la API odată.

Setează această valoare la 1 dacă vrei să traduci câte o linie pe rând. Această opțiune primește prioritate față de opțiunea --xlate-maxlen.

--[no-]xlate-progress (Default: True)

Vedeți rezultatul traducerii în timp real în ieșirea STDERR.

--match-all

Setați întregul text al fișierului ca zonă țintă.

CACHE OPTIONS

Modulul xlate poate stoca textul tradus în cache pentru fiecare fișier și îl poate citi înainte de execuție pentru a elimina costurile de întrebare către server. Cu strategia implicită de cache auto, acesta menține datele cache doar atunci când fișierul cache există pentru fișierul țintă.

--cache-clear

Opțiunea --cache-clear poate fi utilizată pentru a iniția gestionarea cache-ului sau pentru a reîmprospăta toate datele cache existente. Odată executată cu această opțiune, va fi creat un nou fișier cache dacă nu există și apoi va fi menținut automat.

--xlate-cache=strategy
auto (Default)

Mențineți fișierul cache dacă există.

create

Creați un fișier cache gol și ieșiți.

always, yes, 1

Mențineți cache-ul oricum, atâta timp cât ținta este un fișier normal.

clear

Ștergeți mai întâi datele cache.

never, no, 0

Nu utilizați niciodată fișierul cache chiar dacă există.

accumulate

În mod implicit, datele neutilizate sunt eliminate din fișierul cache. Dacă nu doriți să le eliminați și să le păstrați în fișier, utilizați accumulate.

COMMAND LINE INTERFACE

Puteți utiliza cu ușurință acest modul de la linia de comandă folosind comanda xlate inclusă în distribuție. Consultați informațiile de ajutor xlate pentru utilizare.

Comanda xlate funcționează în concordanță cu mediul Docker, deci chiar dacă nu aveți nimic instalat la îndemână, puteți să-l utilizați atâta timp cât Docker este disponibil. Utilizați opțiunea -D sau -C.

De asemenea, deoarece sunt furnizate fișiere make pentru diferite stiluri de documente, traducerea în alte limbi este posibilă fără specificații speciale. Utilizați opțiunea -M.

Puteți combina și opțiunile Docker și make astfel încât să puteți rula make într-un mediu Docker.

Rularea ca xlate -GC va lansa un shell cu depozitul git de lucru curent montat.

Citiți articolul în limba japoneză din secțiunea "VEZI ȘI" pentru detalii.

    xlate [ options ] -t lang file [ greple options ]
	-h   help
	-v   show version
	-d   debug
	-n   dry-run
	-a   use API
	-c   just check translation area
	-r   refresh cache
	-s   silent mode
	-e # translation engine (default "deepl")
	-p # pattern to determine translation area
	-w # wrap line by # width
	-o # output format (default "xtxt", or "cm", "ifdef")
	-f # from lang (ignored)
	-t # to lang (required, no default)
	-m # max length per API call
	-l # show library files (XLATE.mk, xlate.el)
        --   terminate option parsing
    Make options
	-M   run make
	-n   dry-run
    Docker options
	-G   mount git top-level directory
	-B   run in non-interactive (batch) mode
	-R   mount read-only
	-E * specify environment variable to be inherited
	-I * specify altanative docker image (default: tecolicom/xlate:version)
	-D * run xlate on the container with the rest parameters
	-C * run following command on the container, or run shell

    Control Files:
	*.LANG    translation languates
	*.FORMAT  translation foramt (xtxt, cm, ifdef)
	*.ENGINE  translation engine (deepl or gpt3)

EMACS

Încărcați fișierul xlate.el inclus în depozit pentru a utiliza comanda xlate din editorul Emacs. Funcția xlate-region traduce regiunea dată. Limba implicită este EN-US și puteți specifica limba prin invocarea acesteia cu un argument de prefix.

ENVIRONMENT

DEEPL_AUTH_KEY

Setați cheia de autentificare pentru serviciul DeepL.

OPENAI_API_KEY

Cheia de autentificare OpenAI.

INSTALL

CPANMINUS

$ cpanm App::Greple::xlate

TOOLS

Trebuie să instalezi instrumentele de linie de comandă pentru DeepL și ChatGPT.

https://github.com/DeepLcom/deepl-python

https://github.com/tecolicom/App-gpty

SEE ALSO

App::Greple::xlate

App::Greple::xlate::deepl

App::Greple::xlate::gpt3

https://hub.docker.com/r/tecolicom/xlate

https://github.com/DeepLcom/deepl-python

Bibliotecă Python DeepL și comandă CLI.

https://github.com/openai/openai-python

Biblioteca Python OpenAI

https://github.com/tecolicom/App-gpty

Interfața de linie de comandă OpenAI

App::Greple

Consultați manualul greple pentru detalii despre modelul de text țintă. Utilizați opțiunile --inside, --outside, --include, --exclude pentru a limita zona de potrivire.

App::Greple::update

Puteți utiliza modulul -Mupdate pentru a modifica fișierele în funcție de rezultatul comenzii greple.

App::sdif

Utilizați sdif pentru a afișa formatul markerului de conflict alături de opțiunea -V.

ARTICLES

AUTHOR

Kazumasa Utashiro

LICENSE

Copyright © 2023-2024 Kazumasa Utashiro.

This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.