NAME

App::Greple::xlate - módulo de traducción para greple

SYNOPSIS

greple -Mxlate -e ENGINE --xlate pattern target-file

greple -Mxlate::deepl --xlate pattern target-file

VERSION

Version 0.4101

DESCRIPTION

El módulo Greple xlate encuentra los bloques de texto deseados y los sustituye por el texto traducido. Actualmente se implementan los módulos DeepL (deepl.pm) y ChatGPT (gpt3.pm) como motor back-end. También se incluye soporte experimental para gpt-4 y gpt-4o.

Si desea traducir bloques de texto normal en un documento escrito en el estilo vaina de Perl, utilice el comando greple con el módulo xlate::deepl y perl de la siguiente manera:

greple -Mxlate::deepl -Mperl --pod --re '^([\w\pP].*\n)+' --all foo.pm

En este comando, la cadena de patrones ^([\w\pP].*\n)+ significa líneas consecutivas que comienzan con letras alfanuméricas y de puntuación. Este comando muestra resaltada el área a traducir. La opción --all se utiliza para producir el texto completo.

A continuación, añada la opción --xlate para traducir el área seleccionada. Entonces, encontrará las secciones deseadas y las reemplazará por la salida del comando deepl.

Por defecto, el texto original y traducido se imprime en el formato "marcador de conflicto" compatible con git(1). Usando el formato ifdef, puede obtener la parte deseada mediante el comando unifdef(1) fácilmente. El formato de salida puede especificarse mediante la opción --xlate-format.

Si desea traducir todo el texto, utilice la opción --match-all. Es un atajo para especificar el patrón (?s).+ que coincide con todo el texto.

Los datos en formato de marcador de conflicto pueden visualizarse en estilo lado a lado mediante el comando sdif con la opción -V. Dado que no tiene sentido comparar por cadena, se recomienda la opción --no-cdif. Si no necesita colorear el texto, especifique --no-textcolor (o --no-tc).

sdif -V --no-tc --no-cdif data_shishin.deepl-EN-US.cm

NORMALIZATION

El procesamiento se realiza en unidades especificadas, pero en el caso de una secuencia de varias líneas de texto no vacías, se convierten juntas en una sola línea. Esta operación se realiza del siguiente modo:

  • Se eliminan los espacios en blanco al principio y al final de cada línea.

  • Si una línea termina con un carácter de puntuación de ancho completo, concaténela con la línea siguiente.

  • Si una línea termina con un carácter de ancho completo y la línea siguiente comienza con un carácter de ancho completo, concatene las líneas.

  • Si el final o el principio de una línea no es un carácter de ancho completo, concaténelas insertando un carácter de espacio.

Los datos de la caché se gestionan en función del texto normalizado, por lo que aunque se realicen modificaciones que no afecten a los resultados de la normalización, los datos de traducción almacenados en la caché seguirán siendo efectivos.

Este proceso de normalización sólo se realiza para el primer patrón (0) y los patrones pares. Por lo tanto, si se especifican dos patrones como los siguientes, el texto que coincida con el primer patrón se procesará después de la normalización, y no se realizará ningún proceso de normalización en el texto que coincida con el segundo patrón.

greple -Mxlate -E normalized -E not-normalized

Por lo tanto, utilice el primer patrón para texto que deba procesarse combinando varias líneas en una sola, y utilice el segundo patrón para texto preformateado. Si no hay texto que coincidir en el primer patrón, utilice un patrón que no coincida con nada, como (?!).

MASKING

En ocasiones, hay partes del texto que no desea traducir. Por ejemplo, las etiquetas de los archivos markdown. DeepL sugiere que, en tales casos, la parte del texto que debe excluirse se convierta en etiquetas XML, se traduzca y, una vez finalizada la traducción, se restaure. Para ello, es posible especificar las partes que no deben traducirse.

--xlate-setopt maskfile=MASKPATTERN

Esto interpretará cada línea del fichero `MASKPATTERN` como una expresión regular, traducirá las cadenas que coincidan con ella, y revertirá tras el proceso. Las líneas que empiezan por # se ignoran.

Un patrón complejo puede escribirse en varias líneas con una barra invertida y una nueva línea.

Cómo se transforma el texto mediante el enmascaramiento puede verse con la opción --xlate-mask.

Esta interfaz es experimental y está sujeta a cambios en el futuro.

OPTIONS

--xlate
--xlate-color
--xlate-fold
--xlate-fold-width=n (Default: 70)

Invoca el proceso de traducción para cada área coincidente.

Sin esta opción, greple se comporta como un comando de búsqueda normal. Por lo tanto, puede comprobar qué parte del archivo será objeto de la traducción antes de invocar el trabajo real.

El resultado del comando va a la salida estándar, así que rediríjalo al archivo si es necesario, o considere usar el módulo App::Greple::update.

La opción --xlate llama a la opción --xlate-color con la opción --color=nunca.

Con la opción --xlate-fold, el texto convertido se dobla por el ancho especificado. La anchura por defecto es 70 y puede ajustarse con la opción --xlate-fold-width. Se reservan cuatro columnas para la operación de repliegue, por lo que cada línea puede contener 74 caracteres como máximo.

--xlate-engine=engine

Especifica el motor de traducción que se utilizará. Si especifica el módulo del motor directamente, como -Mxlate::deepl, no necesita utilizar esta opción.

En este momento, están disponibles los siguientes motores

  • deepl: DeepL API

  • gpt3: gpt-3.5-turbo

  • gpt4: gpt-4-turbo

  • gpt4o: gpt-4o-mini

    La interfaz de gpt-4o es inestable y no se puede garantizar que funcione correctamente por el momento.

--xlate-labor
--xlabor

En lugar de llamar al motor de traducción, se espera que trabajen para. Después de preparar el texto a traducir, se copia en el portapapeles. Se espera que los pegue en el formulario, copie el resultado en el portapapeles y pulse Retorno.

--xlate-to (Default: EN-US)

Especifique el idioma de destino. Puede obtener los idiomas disponibles mediante el comando deepl languages si utiliza el motor DeepL.

--xlate-format=format (Default: conflict)

Especifique el formato de salida del texto original y traducido.

Los siguientes formatos distintos de xtxt asumen que la parte a traducir es una colección de líneas. De hecho, es posible traducir sólo una parte de una línea, y especificar un formato distinto de xtxt no producirá resultados significativos.

conflict, cm

El texto original y el convertido se imprimen en formato de marcador de conflicto git(1).

<<<<<<< ORIGINAL
original text
=======
translated Japanese text
>>>>>>> JA

Puede recuperar el archivo original con el siguiente comando sed(1).

sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
colon, :::::::

El texto original y el traducido salen en un estilo contenedor personalizado de markdown.

::::::: ORIGINAL
original text
:::::::
::::::: JA
translated Japanese text
:::::::

El texto anterior se traducirá a lo siguiente en HTML.

<div class="ORIGINAL">
original text
</div>
<div class="JA">
translated Japanese text
</div>

El número de dos puntos es 7 por defecto. Si especifica una secuencia de dos puntos como :::::, se utiliza en lugar de 7 dos puntos.

ifdef

El texto original y el convertido se imprimen en formato cpp(1) #ifdef.

#ifdef ORIGINAL
original text
#endif
#ifdef JA
translated Japanese text
#endif

Puede recuperar sólo el texto japonés mediante el comando unifdef:

unifdef -UORIGINAL -DJA foo.ja.pm
space
space+

El texto original y el convertido se imprimen separados por una sola línea en blanco. Para espacio+, también se imprime una nueva línea después del texto convertido.

xtxt

Si el formato es xtxt (texto traducido) o desconocido, sólo se imprime el texto traducido.

--xlate-maxlen=chars (Default: 0)

Especifique la longitud máxima del texto que se enviará a la API de una sola vez. El valor predeterminado es el mismo que para el servicio gratuito de cuenta DeepL: 128K para la API (--xlate) y 5000 para la interfaz del portapapeles (--xlate-labor). Puede cambiar estos valores si utiliza el servicio Pro.

--xlate-maxline=n (Default: 0)

Especifique el número máximo de líneas de texto que se enviarán a la API de una sola vez.

Establezca este valor en 1 si desea traducir una línea cada vez. Esta opción tiene prioridad sobre la opción --xlate-maxlen.

--[no-]xlate-progress (Default: True)

Ver el resultado de la traducción en tiempo real en la salida STDERR.

--xlate-stripe

Utilice el módulo App::Greple::stripe para mostrar las partes coincidentes en forma de rayas de cebra. Esto es útil cuando las partes coincidentes están conectadas espalda con espalda.

La paleta de colores cambia según el color de fondo del terminal. Si desea especificarlo explícitamente, puede utilizar --xlate-stripe-light o --xlate-stripe-dark.

--xlate-mask

Realiza la función de enmascaramiento y muestra el texto convertido tal cual sin restaurar.

--match-all

Establece todo el texto del fichero como área de destino.

CACHE OPTIONS

El módulo xlate puede almacenar en caché el texto traducido de cada fichero y leerlo antes de la ejecución para eliminar la sobrecarga de preguntar al servidor. Con la estrategia de caché por defecto auto, mantiene los datos de caché sólo cuando el archivo de caché existe para el archivo de destino.

Utilice --xlate-cache=clear para iniciar la gestión de la caché o para limpiar todos los datos de caché existentes. Una vez ejecutado con esta opción, se creará un nuevo archivo de caché si no existe y se mantendrá automáticamente después.

--xlate-cache=strategy
auto (Default)

Mantener el archivo de caché si existe.

create

Crear un archivo de caché vacío y salir.

always, yes, 1

Mantener caché de todos modos hasta que el destino sea un archivo normal.

clear

Borrar primero los datos de la caché.

never, no, 0

No utilizar nunca el archivo de caché aunque exista.

accumulate

Por defecto, los datos no utilizados se eliminan del archivo de caché. Si no desea eliminarlos y mantenerlos en el archivo, utilice acumular.

--xlate-update

Esta opción obliga a actualizar el archivo de caché aunque no sea necesario.

COMMAND LINE INTERFACE

Puede utilizar fácilmente este módulo desde la línea de comandos utilizando el comando xlate incluido en la distribución. Consulte la información de ayuda de xlate para su uso.

El comando xlate funciona conjuntamente con el entorno Docker, por lo que incluso si no tiene nada instalado a mano, puede utilizarlo siempre que Docker esté disponible. Utilice la opción -D o -C.

Además, como se proporcionan makefiles para varios estilos de documento, la traducción a otros idiomas es posible sin especificación especial. Utilice la opción -M.

También puedes combinar las opciones Docker y make para poder ejecutar make en un entorno Docker.

Ejecutando como xlate -GC lanzará un shell con el repositorio git de trabajo actual montado.

Lea el artículo japonés en la sección "SEE TAMBIÉN" para más detalles.

xlate [ options ] -t lang file [ greple options ]
    -h   help
    -v   show version
    -d   debug
    -n   dry-run
    -a   use API
    -c   just check translation area
    -r   refresh cache
    -s   silent mode
    -e # translation engine (default "deepl")
    -p # pattern to determine translation area
    -x # file containing mask patterns
    -w # wrap line by # width
    -o # output format (default "xtxt", or "cm", "ifdef")
    -f # from lang (ignored)
    -t # to lang (required, no default)
    -m # max length per API call
    -l # show library files (XLATE.mk, xlate.el)
    --   terminate option parsing
Make options
    -M   run make
    -n   dry-run
Docker options
    -G   mount git top-level directory
    -B   run in non-interactive (batch) mode
    -R   mount read-only
    -E * specify environment variable to be inherited
    -I * docker image name or version (default: tecolicom/xlate:version)
    -D * run xlate on the container with the rest parameters
    -C * run following command on the container, or run shell

Control Files:
    *.LANG    translation languates
    *.FORMAT  translation foramt (xtxt, cm, ifdef, colon, space)
    *.ENGINE  translation engine (deepl, gpt3, gpt4, gpt4o)

EMACS

Cargue el fichero xlate.el incluido en el repositorio para usar el comando xlate desde el editor Emacs. La función xlate-region traduce la región dada. El idioma por defecto es EN-US y puede especificar el idioma invocándolo con el argumento prefijo.

ENVIRONMENT

DEEPL_AUTH_KEY

Establezca su clave de autenticación para el servicio DeepL.

OPENAI_API_KEY

Clave de autenticación OpenAI.

INSTALL

CPANMINUS

$ cpanm App::Greple::xlate

TOOLS

Debe instalar las herramientas de línea de comandos para DeepL y ChatGPT.

https://github.com/DeepLcom/deepl-python

https://github.com/tecolicom/App-gpty

SEE ALSO

App::Greple::xlate

App::Greple::xlate::deepl

App::Greple::xlate::gpt3

ARTICLES

AUTHOR

Kazumasa Utashiro

LICENSE

Copyright © 2023-2024 Kazumasa Utashiro.

This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.