domingo, 18 de julio de 2010

Privacidad en servicios gratuitos y miedo a la traducción automática

SDL Trados 2007 SP2 incluyó en su día un enlace a su propio servicio de traducción automática (MT). Si el usuario lo activaba, los segmentos (=frases) nuevos que no encontraban coincidencias en la memoria de traducción (TM) pasaban por este servicio de MT en línea y se devolvía la traducción debidamente marcada como "peligrosa". Esto marcaba el principio de un cambio de modelo de traductor a posteditor en sistemas de producción de escritorio.

Con SDL Trados 2009 SP2 se introducen proveedores de MT alternativos, como Google Translate o Language Weaver. Incluso SDL anunció a principios de mes la conexión a Microsoft Translator en su SDL TMS, su software de servidor corporativo para grandes volúmenes de traducción.

En la industria de la traducción se armó un gran revuelo al poner la MT al alcance del traductor común. Por una parte, porque ciertos clientes no querían que se utilizara MT bajo ningún concepto, aunque luego el traductor cambiara el texto de arriba abajo. Los clientes temían que el traductor se pegara demasiado al texto original o pasara por alto errores de la máquina, según el caso. Caen en el error de ver la MT como un sustituto de las habilidades del traductor en lugar de como una simple ayuda que acepta o rechaza el traductor en su calidad de experto posteditor.

En segundo término se dieron cuenta de otro problema: se estaban enviando fragmentos de texto potencialmente confidenciales a "terceras partes". Imaginemos el caso de una nota de prensa sobre una fusión de empresas que, filtrada antes de tiempo, puede provocar movimientos interesados de acciones en la bolsa, lo que se llama "abuso de información privilegiada" (insider trading). Las autoridades reguladoras podrían imponer multas multimillonarias a las empresas implicadas si sospechan de estas prácticas.

Personalmente, todo esto me parece una tontería. En los acuerdos de confidencialidad que suelen gobernar las relaciones entre los proveedores de traducción y sus clientes, se suelen utilizar términos vacíos para generalizar, como "terceras partes" o "terceros". Cosas de abogados, que son algo paranoicos. Estos "terceros" pueden ser un corredor de bolsa, la vecina del 4º, el loro del zoo o una máquina (no necesariamente consciente de sí misma, como Skynet). El caso es que se olvidan de la diferencia entre una máquina y un humano. Un ordenador no tiene mayor interés en comprar acciones, y al fin y al cabo la información que se envía a un proveedor de MT es sesgada, ya que son fragmentos sueltos que, de todas formas, no lee ningún humano. Estos fragmentos de texto son para consumo de la máquina, que puede almacenar información anónima para analizar en qué tipo de textos están interesados sus usuarios. En cualquier caso, todo esto está regido por los términos y condiciones del servicio.

Es como cuando Google integró AdWords en Gmail y se supo que una máquina leía los correos de los usuarios para ofrecer anuncios personalizados. Medio mundo puso el grito en el cielo y se desaconsejó el uso de Google Apps para empresas. No sé qué problema de privacidad veían, sinceramente. Cualquier correo es "leído" por varios servidores, conforme rebota por Internet hasta llegar a su destino. Si al tener correo gratis, me tengo que comer anuncios, lo acepto. Y mejor si son anuncios que me interesan, ¿no?

En resumen, las dos preocupaciones de los compradores de traducción, la reducción de calidad y la confidencialidad, no tienen mucho sentido.

En SDL Trados 2009 SP2, después de mucha insistencia y mucho rasgarse las vestiduras la comunidad, SDL añadió un cuadro de diálogo de confirmación advirtiendo del envío de información potencialmente confidencial a un servidor externo. Obviamente, si quieres que Google Translate te pretraduzca texto, habrá que enviarle el texto antes. Pues parece que algunos no lo entendían, de ahí que SDL tuviera que añadir el cuadro de diálogo de marras. En el blog de Pangeanic se habla del tema, indicando que también se envían los cambios del traductor al texto que ha pretraducido Google:
"There is a huge difference between providing an online post-editing environment with plain text as i/o and picking up human-approved segments from desktop applications."
Sólo se alimenta el motor de Google si utilizas a) la interfaz web de Google Translate o b) Google Translator Toolkit. En el primer caso, tienes que subir tu propuesta expresamente. En el segundo caso, puedes configurarlo para que tus documentos sean privados y no se alimente el motor con tus traducciones. SDL afirma en los foros de Proz que no devuelve los cambios introducidos en la postedición a Google. En cualquier caso, según lo entiendo, el API de Google Translate no permite que terceros envíen sugerencias.

Esta semana SDL ha anunciado la compra de Language Weaver, uno de los proveedores de MT más avanzados. SDL ya compró Trados en 2005, Passolo en 2007 e Idiom en 2008, entre otros. La compra de Language Weaver por parte de SDL integra otra sección del mercado en las ofertas de la compañía. Ya no hace falta que los señores clientes se salgan de SDL para comprar soluciones de MT. La mayor ventaja de Language Weaver, al tratarse de MT estadística, consiste en ofrecer motores personalizados a las necesidades de los clientes, por lo que SDL apunta a consolidar el mercado corporativo en este aspecto, ya que esta personalización no sale barata. Para el mercado, no creo que sean buenas noticias que una empresa vaya quedándose con cada vez más trozos del pastel. Esto sólo lleva al monopolio, donde los usuarios siempre pierden.

En 2005 SDL era mayoritariamente una empresa de traducción, más que una empresa tecnológica. Al comprar Trados, SDL pasó a ser una empresa de traducción que vendía software tecnológico a otras empresas de traducción. Esto no le hizo mucha gracia a otras empresas de traducción, que se vieron atrapadas. Volviendo a lo anterior, donde creo haber dejado más o menos claro que SDL no envía información de postedición a Google, muchos pueden dudar de las buenas intenciones de SDL en un futuro respecto a esta misma información cuando se utilice Language Weaver. El departamento de relaciones públicas de SDL va a estar entretenido las próximas semanas.

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.