Líos meidin Twitter, el ocaso de las TM y el traductor como obstáculo

Esto del Twitter es divertidísimo. Ando algo perdido con la sobredosis de información por varios frentes, pero me entretengo mucho. El Twitter para los periodistas es una mina de oro de comentarios malinterpretados, salidas de tono y polémicas en general (Nacho Vigalondo, Jordi González, Alejandro Sanz...). Yo no soy periodista, pero también le puedo sacar provecho remezclando y comentando lo que leo.

Dramatis personae (en orden de aparición):

  • Jaap van der Meer (inicia el debate offline, digo, fuera de escena): gurú supremo de la automatización en GILT, de la traducción automática (MT), director de TAUS y fundador de la iniciativa TDA
  • Kirti Vashee: gurú de la (S)MT y Vicepresidente de AsiaOnline
  • Roberto Beninatto: consultor, gurú de la industria GILT y ex de la prestigiosa Common Sense Advisory
  • Jost Zetsche: traductor, formador y autor de The Translator's Toolbox (recurso imprescindible)
  • Manuel Herranz: traductor, evangelizador de motores MT personalizados y director de Pangeanic, además de ser mi ex jefe y, en parte, mentor

El merder La acción comienza en la LISA Open Standards Summit (y aquí el hashtag, muy interesante), desde la que Jaap suelta una bomba: "GMS/TMS will disappear over time in favor of plug-ins to other systems". No está mal: Idiom Worlderserver, SDL TMS y demás ya no sirven. Ahora lo que se lleva son los plugins de localización de los distintos CMS. Es decir, en lugar de un sistema de gestión de la traducción (más info: TMS, artículo que por cierto escribí yo) que se conecta a otros sistemas, el sistema de gestión de contenidos tendrá un plugin que exportará el contenido solicitado a XLIFF, o que se conectará a un repositorio de contenido localizable o que se conectará a un sistema de traducción de escritorio. Vaya usted a saber.

Por otra parte, Jaap dice: "Within 5 years, TM will not exist. It will all be corpus-based. We need to make the shift." Jost, que es perro viejo y no se traga estos titulares apocalípticos, le dice "Another 5-year rule???", refiriéndose quizá a cuando en 1954 los investigadores del proyecto Georgetown dijeron que la MT sería un problema resuelto en menos de cinco años (¡ja!). No demos a las memorias de traducción por muertas tan rápido. Y aquí tendría que haberse acabado la discusión, pero esto es Twitter.

Comentando el primer tuit de Jaap, Kirti indica que los TMS son muy poco útiles y Roberto reconoce que las TM están obsoletas. ¿Alguien se ha dado cuenta de lo que ha pasado aquí? Kirti habla de los sistemas, mientras que Roberto entiende las memorias. En español, las siglas no tienen plural (TMS no es igual a TM), mientras que en inglés sí (TMS sí es igual a TMs, si perdonamos la minúscula). Sigamos.


Jost no está de acuerdo con Roberto sobre la caducidad de las TM. Roberto insiste en que las TM están en las últimas, pero Jost no se deja convencerManuel se muestra de acuerdo con Jost en que las TM no están muertas, peros sí tienen una utilidad limitada. Finalmente, Kirti aclara el entuerto diciendo que se refería a las TMS. Y aquí no ha pasado nada, oiga.

Vale, muy bonito, ¿y esto en qué me afecta como traductor? Si volvemos a la entrada inaugural de este blog, veremos que Méteteme es una castellanización chorra de las dos tecnologías o tendencias más en voga en el mundo GILT en los últimos veinte años: MT+TM, es decir, la conjunción de la traducción automática con las memorias de traducción. Sin embargo, ahora dos grandes gurús de la industria GILT afirman que las TM han tenido su edad de oro, pero que ya están en franco declive. ¿Cómo pueden decir esto?

Recopilemos. La gracia de las memorias está en "no tener que traducir dos veces la misma frase", que es, al fin y al cabo, para lo que fueron concebidas. En segundo lugar, las memorias sirven para mostrar coincidencias parciales: "lo que traduces ahora se parece en x% a esto otro que tradujiste hace dos meses, ¿te sirve?". Y en último lugar, para hacer búsquedas: "me suena que esto lo he traducido antes, voy a buscar este término en la memoria". Punto uno por el que las TM no son el Santo Grial. La utilidad de una memoria depende por completo de su calidad y de la confianza que depositemos en ella. Si el cliente nos dice "usa esta TM" y vemos que la TM es un campo de minas: está plagada de errores tipográficos, falsos sentidos, mal estilo o coincidencias erróneas... esa memoria causa más problemas de los que resuelve.

Punto dos por el que las TM no son el Santo Grial. Las coincidencias exactas son una maravilla, pero en ciertos textos las coincidencias parciales tienen una utilidad muy limitada. Ya sea porque el texto tiene un estilo muy literario o muy de marketing que hace que la traducción deba ser muy cohesiva (necesita más reescritura), ya sea porque la frase es larguísima y está llena de términos (algo que he sufrido en manuales de servicio de automoción), el trocito que sí encuentra la memoria quizá sea imposible de reutilizar sin hacer malabarismos.

¿Para qué sirven las memorias? Si le preguntáis a Jaap, os dirá que para entrenar motores de traducción automática por estadística. Si me preguntáis a mí, que soy un mindundi y uso la tecnología en lugar de crearla, os digo que para combinar con una buena MT. En las coincidencias de al menos un 90% (quizá un 85%, depende la longitud de la frase, el tipo de texto, etc), usa la TM. Por debajo de esa cifra, pregunta a la MT. Por supuesto, aquí entiendo que el motor de MT está entrenado para este tipo de texto y está bien entrenado. De lo contrario, la MT es mejor no utilizarla.

Y ahora que he explicado todo este rollo, vuelvo al tema en cuestión: ¿por qué se quieren cargar las TM? Las TM son sinónimo de traducción humana y de grandes costes de localización. La MT con postedición tiene menos costes, pero para ciertas aplicaciones no es práctica (por falta de tiempo y dinero), como por ejemplo en los artículos de la Knowledge Base de Microsoft, el soporte técnico vía chat o vía teléfono mediante inteligencia artificial, el gisting de los foros de usuarios, etc. En estos casos, no hay postedición, sino un motor de MT que prescinde de humanos. Pero lo que más les pone interesa a las empresas "primarias" (las que crean los textos y demás contenido que luego debe localizarse) es la CT3, el crowdsourcing. No solo les sale gratis la traducción, sino que tampoco tienen que currarse un motor de MT para cada par lingüístico. Se crea un único sistema que soporte la localización para un montón de idiomas y a correr. Además, con la CT3 crean una comunidad de usuarios volcados en el producto (o servicio) y que ayudan a promocionarlo.

No quiero con el anterior párrafo conspiranoico quedar como un "es el fin del mundo, traductores, corred a las colinas, corred por vuestras vidas". Simplemente digo que el objetivo de toda empresa en un sistema capitalista es maximizar los beneficios, algo que en parte se consigue minimizando los costes. En este caso, los costes son de traducción: autónomos, equipos de traductores, departamentos de traducción, empresas de servicios lingüísticos, etc.

Actualización: MemoQ entra al trapo y afirma que las TM no solo no están muertas, sino que son mucho más útiles que la MT. Además, su uso de TM tradicionales con coincidencias parciales (de sub-segmento, EBMT, como quueramos llamarlas) da los mejores resultados. Para muchos tipos de texto, estoy de acuerdo.

Comentarios

  1. Acabo de saber vía Fundeu que los prefijos tipo "ex jefe" van juntos: http://www.fundeu.es/recomendaciones-P-prefijos-cuatro-claves-para-una-buena-redaccion-817.html

    Ay, y yo que consulté el DPD: http://buscon.rae.es/dpdI/SrvltConsulta?lema=ex

    He preguntado a Fundéu sobre la falta de actualización del DPD y esta es su respuesta: http://twitter.com/Fundeu/statuses/43273771632701440

    ResponderEliminar
  2. "Méteteme es una castellanización chorra de las dos tecnologías o tendencias en el mundo GILT en los últimos veinte años: MT+TM"

    ¡Pues menos mal que lo has dicho porque había entendido otra cosa! Te he puesto en el blogroll con otro nombre pero lo voy a corregir :)

    ResponderEliminar
  3. Leon: Por aquella época estaba dándole muchas vueltas a cómo integrar satisfactoriamente la MT en un programa de traducción asistida y dije: "mira qué gracioso, MT es como TM, pero al revés". O eso, o acababa de tomarme una doble malta.
    Por cierto, me estoy leyendo tu entrada sobre el IVA, ¡muy interesante!

    ResponderEliminar

Publicar un comentario

Entradas populares de este blog

La posedición: ¿zombificación del traductor?

Impacto de la subida de impuestos (IVA e IRPF) en traductores autónomos

Molestias (y remedios) de no cobrar por no tocar