NAME

App::Greple::xlate - vertaalondersteuningsmodule voor greple

SYNOPSIS

greple -Mxlate -e ENGINE --xlate pattern target-file

greple -Mxlate::deepl --xlate pattern target-file

VERSION

Version 0.99

DESCRIPTION

Het Greple xlate module vindt gewenste tekstblokken en vervangt ze door de vertaalde tekst. Momenteel zijn de DeepL (deepl.pm) en ChatGPT (gpt3.pm) modules geïmplementeerd als back-end engine. Experimentele ondersteuning voor gpt-4 en gpt-4o is ook inbegrepen.

Als je normale tekstblokken wilt vertalen in een document dat is geschreven in de Perl's pod-stijl, gebruik dan het greple commando met de xlate::deepl en perl module als volgt:

greple -Mxlate::deepl -Mperl --pod --re '^([\w\pP].*\n)+' --all foo.pm

In deze opdracht betekent het patroonreeks ^([\w\pP].*\n)+ opeenvolgende regels die beginnen met een alfanumeriek en leesteken. Deze opdracht toont het gebied dat vertaald moet worden gemarkeerd. Optie --all wordt gebruikt om de volledige tekst te produceren.

Voeg vervolgens de optie --xlate toe om het geselecteerde gebied te vertalen. Het zal dan de gewenste secties vinden en ze vervangen door de uitvoer van het deepl commando.

Standaard worden het oorspronkelijke en vertaalde tekst afgedrukt in het formaat van de "conflict marker" dat compatibel is met git(1). Met behulp van het ifdef formaat kun je het gewenste deel krijgen met het unifdef(1) commando. De uitvoerindeling kan worden gespecificeerd met de --xlate-format optie.

Als je de hele tekst wilt vertalen, gebruik dan de --match-all optie. Dit is een snelkoppeling om het patroon (?s).+ te specificeren dat de hele tekst matcht.

Conflict marker formaatgegevens kunnen worden bekeken in een zij-aan-zij stijl met het sdif commando met de -V optie. Aangezien het geen zin heeft om op basis van elke string te vergelijken, wordt de --no-cdif optie aanbevolen. Als je de tekst niet hoeft te kleuren, geef dan --no-textcolor (of --no-tc) op.

sdif -V --no-tc --no-cdif data_shishin.deepl-EN-US.cm

NORMALIZATION

Verwerking gebeurt in opgegeven eenheden, maar in het geval van een reeks van meerdere regels met niet-lege tekst, worden ze samen omgezet in één regel. Deze bewerking wordt als volgt uitgevoerd:

  • Verwijder witruimte aan het begin en einde van elke regel.

  • Als een regel eindigt met een leesteken in volledige breedte, voeg dan samen met de volgende regel.

  • Als een regel eindigt met een volledig breedte karakter en de volgende regel begint met een volledig breedte karakter, voeg dan de regels samen.

  • Als het einde of het begin van een regel geen volledig breedte karakter is, voeg ze dan samen door een spatiekarakter in te voegen.

Cachegegevens worden beheerd op basis van de genormaliseerde tekst, dus zelfs als er wijzigingen worden aangebracht die de normalisatieresultaten niet beïnvloeden, blijven de gecachte vertaalgegevens effectief.

Dit normalisatieproces wordt alleen uitgevoerd voor het eerste (0e) en even genummerde patroon. Als er dus twee patronen worden gespecificeerd zoals volgt, zal de tekst die overeenkomt met het eerste patroon worden verwerkt na normalisatie, en er zal geen normalisatieproces worden uitgevoerd op de tekst die overeenkomt met het tweede patroon.

greple -Mxlate -E normalized -E not-normalized

Gebruik daarom het eerste patroon voor tekst die moet worden verwerkt door meerdere regels tot één regel te combineren, en gebruik het tweede patroon voor vooraf opgemaakte tekst. Als er geen tekst is om overeen te komen met het eerste patroon, gebruik dan een patroon dat niets overeenkomt, zoals (?!).

MASKING

Af en toe zijn er delen van tekst die je niet vertaald wilt hebben. Bijvoorbeeld tags in markdown-bestanden. DeepL suggereert dat in dergelijke gevallen het te negeren deel van de tekst wordt omgezet naar XML-tags, vertaald en vervolgens wordt hersteld nadat de vertaling is voltooid. Om dit te ondersteunen, is het mogelijk om de delen die niet vertaald moeten worden te specificeren.

--xlate-setopt maskfile=MASKPATTERN

Dit zal elke regel van het bestand `MASKPATTERN` interpreteren als een reguliere expressie, strings die eraan voldoen vertalen en na verwerking terugdraaien. Regels die beginnen met # worden genegeerd.

Complex patroon kan worden geschreven op meerdere regels met een backslash geëscapete nieuwe regel.

Hoe de tekst wordt getransformeerd door maskering kan worden gezien via de --xlate-mask optie.

Deze interface is experimenteel en kan in de toekomst worden gewijzigd.

OPTIONS

--xlate
--xlate-color
--xlate-fold
--xlate-fold-width=n (Default: 70)

Roep het vertaalproces aan voor elk overeenkomend gebied.

Zonder deze optie gedraagt greple zich als een normaal zoekcommando. U kunt dus controleren welk deel van het bestand onderwerp zal zijn van de vertaling voordat u daadwerkelijk aan het werk gaat.

Het resultaat van het commando wordt naar standaarduitvoer gestuurd, dus leid het om naar een bestand indien nodig, of overweeg het gebruik van de App::Greple::update module.

Optie --xlate roept de optie --xlate-color aan met de optie --color=never.

Met de optie --xlate-fold wordt de geconverteerde tekst gevouwen volgens de opgegeven breedte. De standaardbreedte is 70 en kan worden ingesteld met de optie --xlate-fold-width. Vier kolommen zijn gereserveerd voor de run-in bewerking, zodat elke regel maximaal 74 tekens kan bevatten.

--xlate-engine=engine

Specificeert de te gebruiken vertaalmotor. Als je de engine module direct specificeert, zoals -Mxlate::deepl, hoef je deze optie niet te gebruiken.

Op dit moment zijn de volgende engines beschikbaar

  • deepl: DeepL API

  • gpt3: gpt-3.5-turbo

  • gpt4: gpt-4-turbo

  • gpt4o: gpt-4o-mini

    De interface van gpt-4o is instabiel en kan op dit moment niet worden gegarandeerd correct te werken.

--xlate-labor
--xlabor

In plaats van de vertaalmotor aan te roepen, wordt er van jou verwacht dat je het werk doet. Nadat de tekst is voorbereid om te worden vertaald, wordt deze gekopieerd naar het klembord. Je wordt verwacht om ze in het formulier te plakken, het resultaat naar het klembord te kopiëren en op enter te drukken.

--xlate-to (Default: EN-US)

Specificeer de doeltaal. U kunt de beschikbare talen krijgen met het deepl languages commando wanneer u de DeepL motor gebruikt.

--xlate-format=format (Default: conflict)

Specificeer het uitvoerformaat voor de oorspronkelijke en vertaalde tekst.

De volgende formaten anders dan xtxt gaan ervan uit dat het te vertalen deel een verzameling regels is. In feite is het mogelijk om slechts een deel van een regel te vertalen, en het specificeren van een ander formaat dan xtxt zal geen zinvolle resultaten opleveren.

conflict, cm

Originele en geconverteerde tekst worden afgedrukt in git(1) conflict marker formaat.

<<<<<<< ORIGINAL
original text
=======
translated Japanese text
>>>>>>> JA

U kunt het oorspronkelijke bestand herstellen met het volgende sed(1) commando.

sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
colon, :::::::

```html

::::::: ORIGINAL
original text
:::::::
::::::: JA
translated Japanese text
:::::::

<div style="background-color: #f4f4f4; color: #333; border-left: 6px solid #c0392b; padding: 10px; margin-bottom: 10px;">

<div class="ORIGINAL">
original text
</div>
<div class="JA">
translated Japanese text
</div>

Aantal dubbele punten is standaard 7. Als je een dubbele puntensequentie opgeeft zoals :::::, wordt deze in plaats van 7 dubbele punten gebruikt.

ifdef

Originele en geconverteerde tekst worden afgedrukt in cpp(1) #ifdef formaat.

#ifdef ORIGINAL
original text
#endif
#ifdef JA
translated Japanese text
#endif

U kunt alleen de Japanse tekst ophalen met het unifdef commando:

unifdef -UORIGINAL -DJA foo.ja.pm
space
space+

Hello! How can I help you today?

xtxt

Als het formaat xtxt (vertaalde tekst) of onbekend is, wordt alleen de vertaalde tekst afgedrukt.

--xlate-maxlen=chars (Default: 0)

Vertaal de volgende tekst naar het Nederlands, regel voor regel.

--xlate-maxline=n (Default: 0)

Specificeer het maximale aantal regels tekst dat tegelijk naar de API wordt verzonden.

Stel deze waarde in op 1 als je regel voor regel wilt vertalen. Deze optie heeft voorrang op de --xlate-maxlen optie.

--[no-]xlate-progress (Default: True)

Bekijk het vertaalresultaat in realtime in de STDERR-uitvoer.

--xlate-stripe

Gebruik de App::Greple::stripe module om het overeenkomende deel te tonen in een zebra-strepenpatroon. Dit is handig wanneer de overeenkomende delen aan elkaar zijn gekoppeld.

Het kleurenpalet wordt aangepast aan de achtergrondkleur van het terminal. Als je dit expliciet wilt specificeren, kun je --xlate-stripe-light of --xlate-stripe-dark gebruiken.

--xlate-mask

Voer maskeringsfunctie uit en toon de geconverteerde tekst zoals het is zonder herstel.

--match-all

Stel de volledige tekst van het bestand in als een doelgebied.

CACHE OPTIONS

De xlate module kan gecachte tekst van vertaling voor elk bestand opslaan en deze lezen vóór de uitvoering om de overhead van het vragen aan de server te elimineren. Met de standaard cache-strategie auto wordt de cache alleen behouden wanneer het cachebestand bestaat voor het doelbestand.

Gebruik --xlate-cache=clear om cachebeheer te starten of om alle bestaande cachegegevens op te schonen. Zodra dit met deze optie is uitgevoerd, wordt er een nieuw cachebestand aangemaakt als dat nog niet bestaat en vervolgens automatisch onderhouden.

--xlate-cache=strategy
auto (Default)

Onderhoud het cachebestand als het bestaat.

create

Maak een leeg cachebestand aan en stop.

always, yes, 1

Onderhoud de cache hoe dan ook zolang het doel een normaal bestand is.

clear

Wis eerst de cachegegevens.

never, no, 0

Gebruik nooit het cachebestand, zelfs als het bestaat.

accumulate

Standaardgedrag is dat ongebruikte gegevens uit het cachebestand worden verwijderd. Als u ze niet wilt verwijderen en in het bestand wilt bewaren, gebruik dan accumulate.

--xlate-update

Deze optie dwingt het bijwerken van het cachebestand af, zelfs als dit niet nodig is.

COMMAND LINE INTERFACE

Je kunt dit module eenvoudig vanaf de commandoregel gebruiken door het xlate commando te gebruiken dat is opgenomen in de distributie. Bekijk de xlate man-pagina voor het gebruik.

Het xlate commando werkt samen met de Docker-omgeving, dus zelfs als u niets geïnstalleerd heeft, kunt u het gebruiken zolang Docker beschikbaar is. Gebruik de -D of -C optie.

Ook worden er makefiles geleverd voor verschillende documentstijlen, zodat vertalingen naar andere talen mogelijk zijn zonder speciale specificatie. Gebruik de -M optie.

U kunt ook de Docker- en make-opties combineren, zodat u make kunt uitvoeren in een Docker-omgeving.

Als u bijvoorbeeld xlate -GC uitvoert, wordt er een shell gestart met het huidige werkende git-repository gekoppeld.

Lees het Japanse artikel in de "ZIE OOK" sectie voor meer details.

xlate [ options ] -t lang file [ greple options ]
    -h   help
    -v   show version
    -d   debug
    -n   dry-run
    -a   use API
    -c   just check translation area
    -r   refresh cache
    -u   force update cache
    -s   silent mode
    -e # translation engine (*deepl, gpt3, gpt4, gpt4o)
    -p # pattern to determine translation area
    -x # file containing mask patterns
    -w # wrap line by # width
    -o # output format (*xtxt, cm, ifdef, space, space+, colon)
    -f # from lang (ignored)
    -t # to lang (required, no default)
    -m # max length per API call
    -l # show library files (XLATE.mk, xlate.el)
    --   end of option
    N.B. default is marked as *

Make options
    -M   run make
    -n   dry-run

Docker options
    -D * run xlate on the container with the same parameters
    -C * execute following command on the container, or run shell
    -A * attach to the live container
    N.B. -D/-C/-A terminates option handling

    -G   mount git top-level directory
    -H   mount home directory
    -V # specify mount directory
    -U   do not mount
    -R   mount read-only
    -K   do not remove and keep live container
    -Q   quit and remove live container
    -E # specify environment variable to be inherited
    -I # docker image or version (default: tecolicom/xlate:version)

Control Files:
    *.LANG    translation languates
    *.FORMAT  translation foramt (xtxt, cm, ifdef, colon, space)
    *.ENGINE  translation engine (deepl, gpt3, gpt4, gpt4o)

EMACS

Laad het bestand xlate.el dat is opgenomen in de repository om het xlate commando te gebruiken vanuit de Emacs-editor. De functie xlate-region vertaalt het opgegeven gedeelte. De standaardtaal is EN-US en je kunt de taal specificeren door het aan te roepen met een voorvoegselargument.

ENVIRONMENT

DEEPL_AUTH_KEY

Stel je authenticatiesleutel in voor de DeepL-service.

OPENAI_API_KEY

OpenAI authenticatiesleutel.

INSTALL

CPANMINUS

$ cpanm App::Greple::xlate

TOOLS

Je moet command line tools installeren voor DeepL en ChatGPT.

https://github.com/DeepLcom/deepl-python

https://github.com/tecolicom/App-gpty

SEE ALSO

App::Greple::xlate

App::Greple::xlate::deepl

App::Greple::xlate::gpt3

ARTICLES

AUTHOR

Kazumasa Utashiro

LICENSE

Copyright © 2023-2024 Kazumasa Utashiro.

This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.