sábado, 12 de febrero de 2011

Mil millones de palabras traducidas en 1 semana

Uso Google Reader para estar al corriente de lo que pasa en el mundo. Encuentro una web que me interesa, o hago un comentario en una entrada de blog, o alguien comparte un artículo de una web que me parece interesante y voy añadiendo el feed (que ahora me entero se traduce como "fuente web") a Google Reader. Un momento, voy a contar cuántas "fuentes webs" sigo. ... 138. No, no las he contado una a una, aunque he estado a punto; se puede ver en Settings -> Subscriptions.

El caso es que, con tantas fuentes, hay momentos en que se me acumula la faena y dejo cosas sin leer. Afortunadamente, Google se preocupa por mí y me borra las entradas no leídas con más de 30 días de antigüedad, para que no me estrese demasiado. Por lo tanto, llega un momento en que tengo que ordenar las entradas por las más antiguas primero para ponerme al día o arriesgarme a perder cosas interesantes. Eso es lo que he estoy haciendo ahora.

Leo en el blog de la Common Sense Advisory que Asia Online tradujo más de 3,5 millones de artículos de la Wikipedia, con más de 1.000 millones de palabras, del inglés al tailandés. En una semana. Obviamente, no hay suficientes traductores para hacer esto en una semana, ni siquiera si en lugar de "traductores", contamos con todos los tailandeses con conocimientos básicos de inglés y de manejo de un PC. Faltaba más, se trata del motor de traducción automática de Asia Online, que rula sobre 50 servidores de cuádruple núcleo.

Es gracioso, porque el artículo reza "[Asia Online's CEO] claims that the actual translations were carried out in just one week". Perdone usted, pero eso no es "la traducción en sí", sino "la pretraducción" o "la traducción automática" (TA). El siguiente párrafo lo aclara, "What comes next is crowdsourced proofreading." Personalmente, no tengo nada que objetar. La traducción automática me parece muy bien para muchos tipos de texto y para muchas combinaciones de idiomas (según el motor de TA) y el CT3 (crowdsourcing) en la traducción (o postedición, como en este caso) me parece perfecto para las traducciones sin ánimo de lucro. Como bien cierra el artículo: "[this much translation] could never be justified on purely commercial grounds".

Ahora que sabemos todo esto no tiene mucho sentido el titular sensacionalista de esta entrada, ¿no? Pues algo parecido pasa con el titular del artículo de CSA cuando lo nombra el "proyecto de traducción más grande jamás concebido". No es un proyecto de traducción. Es el pistoletazo de salida a un proyecto de postedición en clave de crowdsourcing.

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.