martes, 15 de abril de 2014

¿Inglés americano y británico? Los locos locales en las TEnT

Curiosamente, al día siguiente de escribir yo sobre los términos con variantes o las «varias opciones por término», Paul Filkin, la cara visible de SDL, trataba en su blog este mismo tema, también hablando de Glossary Converter, solo que aplicado a las variantes del inglés. También trata en su artículo la creación de una definición de glosario en Multiterm y la concatenación en Excel, temas muy interesantes. ¿Cómo marcar los términos de un glosario como pertenecientes al inglés británico o americano para controlar que no se nos escape la variante equivocada en una traducción al inglés? Muy útil… si trabajas hacia el inglés. Si trabajas desde el inglés estas variantes son más bien un estorbo.

No solo eso. También la insigne @alemanita maldecía la semana pasada que no se pudiera asignar una memoria de traducción en inglés americano a un bitexto (archivo bilingüe) de traducción en inglés británico, y viceversa. Estaba claro que los astros se confabulaban para que hablase de este apasionante tema, del que iba a hablar de todas formas esta semana. Y aquí estoy, dispuesto a aburrir.

(Nota: las variantes de un idioma en informática se denominan locales. No todos los locales son variantes de un idioma, pero eso nos da igual. Aquí solo hablo de inglés británico y de inglés americano, pero Crados cuenta 16 variantes del inglés y 20 del español. Infierno.)

Para empezar: ¿por qué Crados no nos deja combinar las variantes de un idioma que queramos en un proyecto? Al fin y al cabo, podemos utilizar un glosario en_US (inglés americano) en un proyecto en_GB (inglés británico). Paul Filkin lo explicó aprovechando que presentaba la app AnyTM. Crados se apoya en la configuración del proyecto para hacer autosustituciones: reconoce las fechas, cantidades y medidas del en_US y nos las convierte al es_ES (español de España), según la Configuración regional de nuestro Windows. Y estos numeritos se escriben en la memoria. Si tenemos una memoria en_US con los numeritos que siguen las reglas del en_US y luego queremos usar esa memoria en un proyecto en_GB, podemos liarla. Al fin y al cabo, 1/2/14 es el 2 de enero en en_US o el 1 de febrero en en_GB. Crados nos trata como niños y nos impide reutilizar una memoria para un locale distinto.

Sin embargo, todo esto presupone que un proyecto se crea con el locale correspondiente de verdad al texto. Que levanten la manita los gestores de proyecto que, antes de crear un proyecto, miran en qué variedad de inglés está el texto. ¿Nadie? ¿Hay un loco por ahí que sí lo hace? Bien. La mayoría de veces un proyecto se crea con el locale del país donde se encuentra el cliente, que puede ser una agencia que rebota archivos que le llegan desde otra parte del mundo, aunque en otras ocasiones se crea con el locale al que estén acostumbrado el gestor de proyecto, sin más. En la práctica, la probabilidad de que el locale del proyecto coincida con el texto es del 50 %: una mera coincidencia. Así, todo aquello que he contado en el párrafo anterior sobre la correcta autosustitución es pura entelequia.

Existen tres formas de mezclar variantes de inglés en un proyecto:

  1. Exportar la memoria a TMX o similar e importar en otra memoria con el locale que nos interesa. Trados Studio no se queja si el locale del TMX es distinto a la memoria en la que vamos a importarlo. Este método es una verdadera puñeta, porque tienes que exportar, modificar e importar cada vez que la otra memoria se actualice (porque el cliente te envía la nueva versión de la memoria, porque has tenido que trabajar con proyectos de otro locale…), además de mantener un registro para acordarte de mantenerla al día.
  2. Utilizar AnyTM, una app de pago (y no precisamente barata) con la que podremos aprovechar las memorias que queramos, sean del locale que sean (incluso una memoria alemán>español en un proyecto neerlandés>español, si nos apetece), en los proyectos que queramos, sean memorias locales o remotas y sean memorias de Trados Studio, de Trados Workbench, de SDLx o de lo que sean.
  3. No usar Crados, sino memoQ. He estado haciendo pruebas y permite trabajar sin problema alguno con memorias con un locale distinto al proyecto/bitexto, sin quejarse ni una sola vez. De hecho, incluso puedes escoger inglés y español a secas, sin especificar el país.
¿Por qué Crados no se limita a preguntarte si estás seguro de asignar una memoria con un locale distinto al proyecto? Al fin y al cabo, SDL reconoce que la app AnyTM es útil y necesaria. Lo explica Paul Filkin en los comentarios de su artículo. Respuesta corta: por pereza. Respuesta larga: por no romper algo que funciona mal, pero funciona, en muchos productos distintos de SDL (no solo Trados Studio), porque desde hace unos años SDL prefiere dejar que apps de terceros añadan funciones necesarias que deberían añadir ellos de serie.

Por su parte, memoQ no solo te permite añadir la memoria que quieras, sino que combina los resultados de la memoria con glosarios locales y remotos, además de mezclar trozos de la memoria (subsegmentos). Por ejemplo:
  • Segmento 1, sin coincidencias en la memoria: tú traduces «Press HOME» por «Pulse HOME».
  • Segmento 2, sin coincidencias en la memoria: tú traduces «Enter the Home Menu» por «Acceda al menú Inicio».
  • Segmento 3, sin coincidencias en la memoria: te traduce él solito «Press HOME to enter the Home Menu» por «Pulse HOME to Acceda al menú Inicio», corriges la frase y listo.
Un crack, el tío. Y esto es solo un ejemplo básico del autoensamblaje de memoQ, que ya hacía Déjà Vu desde los años 90, pero ahora es mucho más inteligente, claro. Por si os interesa, en mayo hay un taller de memoQ en Madrid coorganizado por Con Trazo Firme y Meowtrad e impartido por Belén Agulló. Que parece que me lleve algo por recomendar memoQ o este taller, pero no.

lunes, 7 de abril de 2014

Conversión de glosarios en Crados y en memoQ

La semana pasada me topé con un glosario bastante útil (con fallitos, pero útil) de términos industriales de la OSHA. Si os fijáis, tiene varias opciones para cada término, separados por comas, además de otras malas prácticas que impiden que se pueda aprovechar el glosario para aumentar la productividad en una TEnT. En Crados-Multiterm (nombre «cariñoso» otorgado por Mox al Trados) se pueden importar glosarios de forma farragosa (pasando por varios asistentes en Multiterm Convert y Multiterm Desktop) o de forma muy sencilla gracias a la app externa Glossary Converter. ¿Cómo trató Glossary Converter estas múltiples opciones por término? No las trató.

Glosario mal importado a Multiterm

Posteriormente me di cuenta de que ya había salido la versión 3 de Glossary Converter en el SDL OpenExchange y yo todavía estaba en la 2. ¿Cómo me enteré de que había una actualización? Entrando en la web, sin más. Ni la propia app ni Crados te avisa cuando hay una versión nueva. Supongo que Crados 2014 sí que avisará, porque tiene las apps integradas en la interfaz, pero los que estamos con 2011 o con 2009 no tenemos esa suerte. Al ver que Glossary Converter 3 ya permitía ajustes, investigué, y la opción «Sinónimo activado compatible con formato excel» parecía prometedora, pero como yo no hablo ese idioma, preferí cambiar la interfaz al inglés. Ahora sí, «Activate synonym suport in Excel files». Tela con la localización al español de la app.

Opciones de importación de Glossary Converter

Ahí especificas cuál es el separador de opciones dentro de un mismo término y entonces sí te lo convierte bien. Este es el resultado.

Glosario bien importado a Multiterm

Es curioso que SDL deje una parte tan importante de su funcionalidad (conversión de glosarios, casi nada) en manos de terceros. Me pregunto qué habría pasado si en su día Crados no se hubiera alzado con el título de estándar de facto, si hubiera ganado quien realmente se lo merecía (de los 90 me quedo con Déjà Vu), o al menos, si no hubiera habido un claro ganador. Me pregunto si hoy día la mayoría de traductores que trabajen con TEnT aprovecharían el aumento de productividad y de calidad que supone que un entorno de traducción a) te sugiera términos cuando corresponde, b) te permita autocompletarlos con solo teclear un par de veces y c) te permita hacer un control de terminología semiautomatizado. Algún día me gustaría escribir una ucronía tipo Let's Kill Hitler!/Making History/Misfits 3×4, pero con Crados, si no fuera porque no es lo mío. En fin.

El caso es que, al igual que la última vez que hablé de glosarios aquí, me pasé por memoQ a ver cómo trataba esta TEnT un glosario con varias opciones por término. Y bien, oye, bien. No solo tiene suficientes opciones, sino que también te previsualiza cómo quedarán los campos.

Ajustes de importación de terminología de memoQ

Este glosario necesitó varios ajustes antes de poder utilizarse cómodamente en una TEnT. Tuve que separar lo que consideré notas de uso (categoría gramatical, contextos, aclaraciones) en otros campos y completar ciertos términos que en sus opciones alternativas solo incluían la segunda parte del término. Todo esto antes de convertirlo, todavía en Excel, que es más cómodo. Aquí tenéis el glosario de términos industriales de la OSHA, en TXT con tabulaciones, listo para cargar en memoQ, en Multiterm y en TBX (estándar de terminología que no usa nadie): Dropbox, Google Drive y Microsoft OneDrive.

Antes de acabar, quería recomendaros el taller de memoQ en Madrid el 10 de mayo que impartirá Belén Agulló. Yo acabo de apuntarme porque, por las razones que cuento aquí y alguna que otra más que contaré en las próximas semanas, me estoy cansando de ciertas tonterías de SDL y memoQ me está gustando mucho, con lo que voy a pasarme progresivamente a memoQ. A Belén prácticamente no la conozco, pero sé que estuvo en un memoQFest, que está certificada como profesora por Kilgray (los desarrolladores de memoQ) y me da la impresión de ser muy inteligente. Tenéis hasta el 10 de abril para apuntaros a precio reducido y, mientras os decidís, podéis apuntaros a un webinario gratis de memoQ. Yo estaré en el del día 9 de abril y en el del 15.