sábado, 8 de noviembre de 2008

Llegamos a la convergencia (I)

Por lo que respecta al software para traducción, cuando hablamos de "convergencia", podemos referirnos a la convergencia en traducción automática. Así, el modelo híbrido de traducción automática tiene un poco de RBMT y un poco de SMT. Es a lo que apunta uno de los dinosaurios en este campo, los franceses de Systran. Hasta hace un par de añitos, eran los reyes indiscutibles de la automatización. No es que fueran los mejores, es que eran los únicos. Pero luego llegó gente como LanguageWeaver y Google Translate, que le han hecho mucho daño. Pero allí siguen ellos tan panchos; mientras sean los únicos europeos que pintan algo en la MT, serán los únicos que considere la Comisión Europea para sus necesidades (y luego nuestros políticos critican los mercados proteccionistas).

Pero no me refiero a la convergencia entre modelos de MT. Me refiero a lo que da nombre a esta página, la convergencia entre sistemas de traducción de máquina y traducción asistida. Cuando bauticé este bitácora, como medio para investigar un tema que no me llamaba mucho, pero con el que el jefe no paraba de incordiar, me pareció que todavía quedaba lejos un futuro en el que traductor y máquina se entendieran con eficiencia, pero durante el mes pasado (un añito ha pasado desde el gran cambio) me he dado cuenta de que el futuro ya está aquí. Ya hay sistemas suficientemente productivos como para ser necesario su uso inmediato en una cadena de producción, sin importar lo pequeña que sea la empresa, aunque sea unipersonal (es decir, autónomo). Adaptarse o desaparecer.

Comenzaré por los sistemas que he estudiado y menos me atraen, o al menos, que menos se adaptan a las necesidades de la empresa donde trabajo.

Atril Déjà Vu
Los chicos de Atril se lo curran bastante con estrategias no monopolistas, escuchando a sus clientes y manteniendo una interfaz muy agradable y personalizable, de la que SDLx es un calco evidente, con todas las ventajas que ello conlleva si te encanta la interfaz de SDLx. En dos puntos no tiene rival: su sistema de filtrado (ocultación) por tipo de segmento (sin traducir, sin confirmar, coincidencias parciales, etc) para una revisión selectiva, y la capacidad de exportación a archivos RTF bilingües en dos columnas que se pueden editar tranquilamente y, oh maravilla de las maravillas, importar de vuelta a Déjà Vu con los cambios del revisor, que puede trabajar con tan solo un software editor de texto enriquecido.

No es traducción automática en sentido estricto, pues se nutre de intervención humana. Este método, conocido como EBMT, combina o ensambla terminología y fraseología definidas por el usuario, ya sea de forma manual o semiautomática con intervención humana. Luego el usuario o posteditor "encola" las partes que ofrece el software con los nexos adecuados. En el ejemplo siguiente (sacado de la documentación de Swordfish, un software que me reservo para el final), el posteditor se encarga de marcar estas palabras en negrita como términos válidos para el autoensamblaje:

El gato es negro
El gato es blanco (el término "gato" se traduce solo)
El perro es negro (el término "negro" se traduce solo)
El perro es blanco

Las palabras con significado se traducen solas y en este ejemplo ni siquiera hace falta "encolarlas" con un artículo o un verbo, ya que el programa toma "El gato es negro" de la TM y aplica los términos "perro" y "blanco" del glosario. Cuando haya variaciones gramaticales (el caso más habitual), la intervención del posteditor será necesaria, pues se trata de un programa TAO más que de un sistema de MT.

Si se pasa el tiempo suficiente "alimentando" el sistema, los resultados pueden ser muy buenos en campos y con tipos de texto concretos. Pero es difícil convencer a los traductores de que pasen tiempo allanando el terreno a los que vienen después. No nos damos cuenta de que los que venimos después podemos ser nosotros mismos. En fin, opción descartada por tener un FUD superior a los beneficios a corto plazo en eficiencia.

Alchemy Publisher
Este software sólo tiene unos pocos meses y viene de Alchemy, los irlandeses que nos trajeron Alchemy Catalyst, el software estándar para la localización de software. Publisher se centra en los formatos de archivo de documentación, con una interfaz clavada a la de Catalyst. La gracia de los programas de Alchemy es que se puede traducir el archivo con el diseño original. Es decir, es el único software WYSIWYG de su categoría. Esto podrá ser bueno o malo, ya que el formato puede distraer al traductor, que tiene que centrarse en el contenido (texto) que en el continente (formato), pero esto ya es otro debate. Personalmente, pienso que ayuda más que molesta, pero aquí entra de nuevo el factor FUD de no querer cambiar lo que se conoce.
Publisher además es muy útil si se mantiene un control de versiones de los documentos. Es decir, si se dispone de la edición multilingüe de la anterior versión del documento. Publisher es único en la medida en que puede mantener el formato de la anterior versión, en lugar de tener que recrearlo con cada cambio de versión. Mi opinión personal es bastante cauta (FUD): lo creeré cuando lo vea en un caso real (no de estudio). De todas formas, a menudo el cliente no quiere proporcionar la versión anterior, pero sí se dispone de la TM, un caso obvio de pescadilla que se muerde la cola: se le da más importancia a la TM que a la versión anterior del documento porque, hasta la llegada de Publisher, la TM es vital, pero la versión anterior sólo es opcional. Ya veremos dentro de unos años, quizá consigan cambiar los hábitos del mercado.

Pero a lo que iba: que yo sepa, han sido los primeros en ver el potencial de la Google Translate API. Cuando la TM (o la versión anterior del documento) no proporciona una coincidencia válida, se le da a un botoncito y el programa le pide la traducción a Google. Sencillo y efectivo. El problema es el descontrol terminológico de una solución SMT no personalizable (a Google no se le puede pedir que use nuestros glosarios), pero para ciertos tipos de documentos esto se puede corregir sin excesivo esfuerzo.

El inconveniente de Publisher es que no es un estándar (de nuevo, la pescadilla: no se usa porque no es un estándar y no es un estándar porque no se usa). Comprar las licencias dentro de un departamento de traducción de una gran empresa seguro que es muy productivo, pero que una LSP consiga que sus externos usen este software es otro cantar. Algunos aceptarán si se les promete clases de formación, descuentos en la compra (los dos negociables con Alchemy por parte del LSP) y, sobre todo, la promesa de enviarles mucho trabajo para rentabilizar el esfuerzo de adquirir la nueva herramienta. Y luego llega el gran debate: ¿deben bajar los precios los autónomos que utilicen una solución de MT+TM con eficiencia probada? Ahí no me meto, será el propio mercado quien hable en los próximos meses.

Por hoy ya está bien, en los próximos días hablaré de las posibilidades de convergencia con Trados y con Swordfish.

1 comentario:

  1. Coincido plenamente con los conceptos vertidos.
    Es fundamental, como bien destaca, el uso correcto de las herramientas informáticas de asistencia de la traducción.
    He publicado algunos artículos que son instructivos para sacar un mayor provecho de estos programas:

    http://blog-de-traduccion.trustedtranslations.com/como-trabajar-en-trados-con-multiterm-2008-12-18.html

    http://blog-de-traduccion.trustedtranslations.com/como-crear-una-base-de-datos-terminologica-2008-12-11.html

    http://blog-de-traduccion.trustedtranslations.com/como-cargar-un-glosario-en-multiterm-2008-12-04.html

    http://blog-de-traduccion.trustedtranslations.com/%c2%bfque-es-multiterm-2008-11-20.html

    http://blog-de-traduccion.trustedtranslations.com/como-importar-y-exportar-memorias-de-traduccion-2008-09-25.html

    http://blog-de-traduccion.trustedtranslations.com/la-opcion-%e2%80%9climpiar%e2%80%9d-de-trados-2008-09-16.html

    http://blog-de-traduccion.trustedtranslations.com/la-consistencia-linguistica-de-un-texto-2008-08-29.html

    Atte.,

    Amelia

    ResponderEliminar

Nota: solo los miembros de este blog pueden publicar comentarios.