lunes, 17 de noviembre de 2008

Llegamos a la convergencia (II)

En la oficina usamos preferentemente SDLx, pero también Trados, cuando el trabajo lo requiere. SDLx en teoría trabaja con su propio módulo de MT, AutoTrans, pero se vende por separado y hace años que está descatalogado. No pude encontrar más datos: SDLx sigue siendo minoritario y no despierta interés como para que sus fans investiguen cómo hacer que se comunique con un sistema de MT. Y SDL se centra más en desarrollar Trados que en su propio software original: cuestión de nombre de marca, supongo.

Trados en teoría (y van dos) es compatible con dos herramientas de MT, Logos y Systran. Tenemos unas cuantas licencias de Systran, pero están muertas de risa porque la única manera documentada de utilizar Systran como motor de MT es desde su propia interfaz que, sinceramente, da pena. Parece pensada más bien para secretarios con idiomas y "dominio" de Office que para un traductor hecho y derecho. Me imagino que se puede trabajar con Systran dentro de Trados+Word (sé que se puede con Wordfast, mediante su barra de herramientas), pero como yo le tengo alergia al Word, hace unos meses me puse a investigar si había alguna posibilidad de trabajar dentro de Trados TagEditor. Y resulta que en el manual de Trados te explica con pelos y señales cómo trabajar con Systran... Sólo que no funciona. Al parecer las cabezas pensantes de Systran eliminaron la compatibilidad con Trados en su última versión, la 6. Ríase usted de Microsoft cuando hace lo imposible para que su software no hable con los de los demás.
El método, que funciona parcialmente con la versión 5 de Systran, es el siguiente. Después de analizar los archivos traducibles mediante Workbench, se exportan los segmentos desconocidos (opción "Export Unknown Segments", en la misma ventana de análisis), a un RTF "formato Systran", con pares de segmentos bilingües (similar a un RTF traducido con Word+Trados). Se pasa el RTF por Systran con los diccionarios que queramos y el RTF resultante se limpia en la TM. Los segmentos con traducción de MT quedan marcados en la TM como tales y se ofrecen con una penalización x (por defecto, 15%). Cuando nos aparece ese segmento dentro de TagEditor, lo posteditamos debidamente y, al subirse a la TM, pierde la penalización y pasa a ser un segmento como cualquier otro.
Ésta es la teoría, pero no funciona del todo. O a mí se me escapa algún detalle tonto. El caso es que el RTF "formato Systran" no lo acaba de entender Systran y traduce tanto la parte donde va el texto origen como la frase el texto destino (si la traducción fuera inglés-español, nos dejaría sólo segmentos español-español), lo que nos da un RTF imposible de limpiar en la TM. Si al final no se trata de un típico EBKC, la solución sería crear una macro para preprocesar el RTF con expresiones regulares que protejan/oculten la parte con el texto origen.
Ya es un método bastante complejo de por sí como para encima añadir el paso adicional de ejecutar una macro sobre el RTF antes de abrirlo en Systran. Además de tener que pagar a alguien para que programe la macro porque no sabes hacer expresiones regulares (tengo que aprender, lo sé...).

Sin embargo, ahora ha aparecido un método extremadamente sencillo para tener MT dentro de TagEditor sin tener que hacer todos estas cabriolas. Actualizarse al SDL Trados 2007 Suite que acaba de salir. El método es muy sencillo: cuando Workbench no encuentra coincidencias para un segmento, le pide al servidor de SDL la frase y ésta aparece traducida en el documento, para que la posteditemos debidamente.
Yo soy de los que piensa que lo más fácil no tiene por qué ser lo mejor, y tengo muchas reservas respecto a este método. Sí, no requiere intervención del usuario, pero:
  1. Te toca tragar con las condiciones de SDL. Si el año que viene deciden hacer el servicio de pago, a soltar la mosca. Si quieres trabajar con otro servicio web de MT de traducción automática como Google, Systran o ProMT, no puedes. Y dudo mucho que se pongan a firmar acuerdos con la competencia: a SDL le va más eso de eliminar la competencia a golpe de talonario, a lo Microsoft.
  2. Dependes de Internet de principio a fin de la traducción. Si el servidor de SDL está colapsado, no puedes trabajar. Si no tienes conexión, no puedes trabajar.
  3. No tienes control terminológico. No puedes decirle al servidor de SDL que use este glosario en lugar del suyo. Sí, obviamente puedes tener un glosario Multiterm activado y usarlo al posteditar, pero es mejor prevenir que curar.
Como tampoco quiero ser injusto, aviso que ahora mismo SDL está de oferta de lanzamiento, con un 10% de descuento para empresas y para autónomos. Quien no quiera calentarse la cabeza, ya sabe.

En la próxima entrada, hablaré de la solución que considero más flexible y potente: Swordfish.

1 comentario:

  1. Me parece muy útil todo lo que comenta de las herramientas que asisten en la traducción, especialmente en los proyectos de gran volumen de palabras.

    ResponderEliminar

Nota: solo los miembros de este blog pueden publicar comentarios.