Entradas

Mostrando las entradas etiquetadas como TA

Traducción automática: mitos y leyendas, luces y sombras

Imagen
Parece que mi anterior entrada ha gustado y ha levantado polvareda. Eso es bueno, hay muchas cosas que aclarar y principios que debatir. El caso es que me he puesto a contestar el comentario de Aurora y al final me he dado cuenta de que daba para una entrada nueva, casualmente con temas que andaba desde hace tiempo con ganas de desarrollar. Agarraos, que vienen curvas. Confidencialidad del profesional, inteligencia artificial y propiedad intelectual Asumir que todo el material que se nos entrega para traducir es confidencial no es algo válido. El ejemplo que he dado en la entrada anterior es el de GlobalVoicesOnline , trabajo que hago pro bono publico o, como se dice hoy día, por crowdsourcing . Son artículos ya publicados en inglés en su web para cuando empiezo a leerlos. Claramente, si está publicado en su web y accesible vía buscadores, Google ya lo ha visto . ¿Qué importa que yo lo pase por Google Translate o por cualquier otro motor público de terceros? Ahora supongamos qu...

La posedición: ¿zombificación del traductor?

Imagen
Los signos de interrogación son esos grandes amigos del periodista que necesita un titular impactante sin tener que mojarse demasiado. Son primos de los verbos en condicional o del "supuesto"; se sueltan bombas y luego se dice "yo no he sido, señoría". Ríos de tinta electrónica han corrido, corren y correrán sobre la traducción automática y lo nociva que es para la percepción del trabajo del traductor . A nadie le sorprende que un cliente utilice Google Translate (antes usaban Babelfish) para traducir su web , un cartel de un negocio , una señal de tráfico ( 1 ,  2  y 3 , en Gales son unos cachondos) o un menú de restaurante . Y ahora voy a soltar la primera bomba sensacionalista: no hay nada malo en utilizar Google Translate o similar de forma profesional . Lo que es una irresponsabilidad (tanto del traductor como del empresario) es  confiar en las máquinas . Y si no, que se lo digan a John Connor . ¡Muere, Google Translate, muere! La traducción aut...

Líos meidin Twitter, el ocaso de las TM y el traductor como obstáculo

Esto del Twitter es divertidísimo. Ando algo perdido con la sobredosis de información por varios frentes, pero me entretengo mucho. El Twitter para los periodistas es una mina de oro de comentarios malinterpretados, salidas de tono y polémicas en general (Nacho Vigalondo, Jordi González, Alejandro Sanz...). Yo no soy periodista, pero también le puedo sacar provecho remezclando y comentando lo que leo. Dramatis personae  (en orden de aparición): Jaap van der Meer (inicia el debate offline , digo, fuera de escena): gurú supremo de la automatización en GILT, de la traducción automática (MT), director de TAUS y fundador de la iniciativa TDA Kirti Vashee : gurú de la (S)MT y Vicepresidente de AsiaOnline Roberto Beninatto : consultor, gurú de la industria GILT y ex de la prestigiosa Common Sense Advisory Jost Zetsche : traductor, formador y autor de The Translator's Toolbox  (recurso imprescindible) Manuel Herranz : traductor, evangelizador de motores MT personaliza...

Mil millones de palabras traducidas en 1 semana

Uso Google Reader para estar al corriente de lo que pasa en el mundo. Encuentro una web que me interesa, o hago un comentario en una entrada de blog, o alguien comparte un artículo de una web que me parece interesante y voy añadiendo el feed (que ahora me entero se traduce como "fuente web") a Google Reader. Un momento, voy a contar cuántas "fuentes webs" sigo. ... 138. No, no las he contado una a una, aunque he estado a punto; se puede ver en Settings -> Subscriptions. El caso es que, con tantas fuentes, hay momentos en que se me acumula la faena y dejo cosas sin leer. Afortunadamente,  Google se preocupa por mí y me borra las entradas no leídas con más de 30 días de antigüedad, para que no me estrese demasiado. Por lo tanto, llega un momento en que tengo que ordenar las entradas por las más antiguas primero para ponerme al día o arriesgarme a perder cosas interesantes. Eso es lo que he estoy haciendo ahora. Leo en el blog de la Common Sense Advisory qu...

World Lens: de la realidad aumentada a la singularidad en tres cómodos pasos

Imagen
Hace un par de semanas la blogosfera se volvió loca por una app de iPhone llamada World Lens . Mi corazoncito de fandroid me hace dudar si se volvió loca porque se trataba de una app para el iPijada, pero eso no importa ahora. Tampoco importa que falle más que una escopeta de feria, lo realmente increíble es que acierte aunque sea de casualidad. Antes de continuar, un vídeo informativo para ponernos en situación: Como vemos, World Lens muestra en la pantalla la traducción de un texto respetando su contexto . Esto se dice pronto, pero es poco menos que magia . Repasemos qué procesos tiene que completar esta app para mostrarnos resultados. En primer lugar, captura una imagen en movimiento y distingue entre texto y su contexto . Google Goggles, que ya cubrí con antelación , solo capta imágenes fijas, además de desprenderlas de su fondo. Después de detectar qué es texto, reconoce los caracteres individuales ( OCR) . A continuación, pasa el texto reconocido por un motor de tra...

Privacidad en servicios gratuitos y miedo a la traducción automática

SDL Trados 2007 SP2 incluyó en su día un enlace a su propio servicio de traducción automática (MT). Si el usuario lo activaba, los segmentos (=frases) nuevos que no encontraban coincidencias en la memoria de traducción (TM) pasaban por este servicio de MT en línea y se devolvía la traducción debidamente marcada como "peligrosa". Esto marcaba el principio de un cambio de modelo de traductor a posteditor en sistemas de producción de escritorio. Con SDL Trados 2009 SP2 se introducen proveedores de MT alternativos, como Google Translate o Language Weaver . Incluso SDL anunció a principios de mes la conexión a Microsoft Translator en su SDL TMS, su software de servidor corporativo para grandes volúmenes de traducción. En la industria de la traducción se armó un gran revuelo al poner la MT al alcance del traductor común. Por una parte, porque ciertos clientes no querían que se utilizara MT bajo ningún concepto , aunque luego el traductor cambiara el texto de arriba abajo....

Antes de la postedición, vino...

la preedición*, claro. Leo en un blog no oficial de Google que los resultados de la traducción automática de Google mejoran "sorprendentemente" al cambiar una simple mayúscula. Bueno, más que cambiar, se corrige una frase que empieza con minúscula incorrectamente. Se entiende por postedición el proceso y producto de que un un traductor humano corrija y apruebe la salida de un motor de traducción automática. Una postedición puede centrarse en trasmitir el mismo significado que el original, en presentar una frase correcta lingüísticamente o en respetar ambas coordenadas. El perfil de un posteditor suele ser distinto del de un traductor, y podría decirse que se acerca más al de un revisor. En muchos ámbitos, el objetivo de la postedición no es cambiar la frase meta por completo, para eso es preferible comenzar desde cero en lugar de aprovechar la potencia de un motor. El objetivo de la postedición es cambiar lo mínimo posible para que el resultado sea válido, sean cuale...

Llegamos a la convergencia (I)

Por lo que respecta al software para traducción, cuando hablamos de "convergencia", podemos referirnos a la convergencia en traducción automática. Así, el modelo híbrido de traducción automática tiene un poco de RBMT y un poco de SMT . Es a lo que apunta uno de los dinosaurios en este campo, los franceses de Systran . Hasta hace un par de añitos, eran los reyes indiscutibles de la automatización. No es que fueran los mejores, es que eran los únicos. Pero luego llegó gente como LanguageWeaver y Google Translate , que le han hecho mucho daño. Pero allí siguen ellos tan panchos; mientras sean los únicos europeos que pintan algo en la MT , serán los únicos que considere la Comisión Europea para sus necesidades (y luego nuestros políticos critican los mercados proteccionistas). Pero no me refiero a la convergencia entre modelos de MT. Me refiero a lo que da nombre a esta página, la convergencia entre sistemas de traducción de máquina y traducción asistida. Cuando bauticé este ...

Comparación de motores de TA

Respecto a la entrada anterior, alguien puede estar preguntándose cómo es posible que una traducción automática no sea evidente a simple vista. Bueno, en su momento lo achacamos a que no es una hablante nativa del inglés, de ahí las deficiencias en el estilo y la expresión. Pero la conclusión que leo yo en todo esto es que los motores de traducción automática están muy avanzados, casi emulan a un hablante no nativo. Obviamente, no se les puede dejar solos, pero son una gran ayuda. Hay dos grandes familias en la traducción automática : la TA por reglas (análisis morfosintático + diccionario) y la TA por estadística (alimentada con corpora textuales). La primera tiene Systran ( Babelfish ). La segunda tiene a Google Translator , entre otros. La ventaja de la segunda sobre la primera es que su capacidad para crecer (enlace muy interesante) es infinita y, si recordamos a Darwin, está claro quién tiene las de ganar. He hecho un estudio rapidito ( GoogleDocs ) introduciendo mi primera ...

Cara dura

Supongamos que tenemos una traductora del idioma x al inglés. No es nativa del inglés, pero hemos comprobado que es más difícil tratar con nativos del inglés. No se trata de tenerle manía a una cultura o a un país concreto, ni de abaratar costes. Simplemente, hay menos anglófonos que hablen el idioma x que nativos del idioma x que hablen inglés. Obviamente, la expresión no es tan natural, pero sí tienen una actitud distinta, la de tener ganas de trabajar. Y esto no me lo invento yo, lo dice un cliente inglés nuestro. En fin, a lo que vamos. Tenemos una traductora del idioma x al inglés con la que no estamos nada contentos, pero no logramos encontrar otra persona que acepte textos tan técnicos en una lengua tan minoritaria. El caso es que estamos investigando la incorporación de la traducción automática a nuestro flujo de trabajo. Que nadie se asuste, no se trata de rebajar la calidad, sino de ahorrar tiempo y esfuerzo (lo que significa abaratar costes, sí). Pues el otro día se nos oc...