miércoles, 26 de diciembre de 2007

Propósito para el 2008

Nada de aprender otro idioma, ni ir al gimnasio, ni nada parecido. Mi propósito para este año es NO comprar un subportátil como el Asus eeePC.

Este pequeñín, características técnicas aparte, viene con GNU/Linux preinstalado, concretamente una versión personalizada del Xandros. Por una parte, es una lástima que hayan optado por una de las distros de Linux con menos espíritu libre que existen: junto a Linspire y Novell vienen a ser la avanzadilla de Microsoft en el mundo del software libre. Pero lo cierto es que les ha quedado una interfaz extremadamente sencilla y efectiva; dudo mucho que al usuario medio le haga falta algo más.
Con el sistema operativo predeterminado, más que un PC completo parece una PDA muy avanzada, pero al usuario avanzado siempre le queda eeeXubuntu, una versión personalizada de Xubuntu, el escritorio ligero de Ubuntu que corre bajo Xfce. El cacharro lleva un par de meses en la calle, pero ya le han conseguido colocar Windows XP, Ubuntu, PCLinuxOS, etc.

Antes de que alguien se lance a eBay a por el eeePC, avisaré que también está el Cloudbook, que viene con gOs (un sistema operativo basado en Ubuntu y orientado al trabajo con Google), mayor almacenamiento (aunque más lento, pues prefiere el disco duro a la SSD del eeePC), más procesador, más memoria, mejor cámara, etc. Pero lo que de verdad corta el bacalao en el Cloudbook es que a mediados del 2008 podría salir una versión con pantalla táctil por un precio similar.

Los dos aparatitos rondan los 400 USD, que una vez le sumas el IVA europeo y la caradura el desparpajo habitual de estos fabricantes, se convierten en 400 EUR. Con suerte.

sábado, 8 de diciembre de 2007

Comparación de motores de TA

Respecto a la entrada anterior, alguien puede estar preguntándose cómo es posible que una traducción automática no sea evidente a simple vista. Bueno, en su momento lo achacamos a que no es una hablante nativa del inglés, de ahí las deficiencias en el estilo y la expresión. Pero la conclusión que leo yo en todo esto es que los motores de traducción automática están muy avanzados, casi emulan a un hablante no nativo. Obviamente, no se les puede dejar solos, pero son una gran ayuda.

Hay dos grandes familias en la traducción automática: la TA por reglas (análisis morfosintático + diccionario) y la TA por estadística (alimentada con corpora textuales). La primera tiene Systran (Babelfish). La segunda tiene a Google Translator, entre otros. La ventaja de la segunda sobre la primera es que su capacidad para crecer (enlace muy interesante) es infinita y, si recordamos a Darwin, está claro quién tiene las de ganar.

He hecho un estudio rapidito (GoogleDocs) introduciendo mi primera entrada aquí, traduciéndola al inglés, posteditándola (es decir, revisándola yo) y devolviéndola al español.

El resultado con Google Translator (aquí tenéis un complemento para Firefox) sin revisión alguna es el siguiente:

InauguraciónHola, bienvenidos a este nuevo blog sobre la tecnología de la información, de localización de conocimiento libre. De hecho, el título de este blog es un mal juego de palabras MT - TM, el lugar de reunión de herramientas de traducción automática con las herramientas de traducción asistida. Después de todo, todo el mundo tiene un mal momento de inspiración.Soy un traductor en una empresa española de la misma esfera. Además, yo soy el Director Técnico de la compañía y la principal razón de la creación de este espacio es que yo apenas tengo tiempo para llegar al día en el trabajo. Por lo tanto, yo mismo me fuerza a la investigación del mercado de la traducción y todas las nuevas tecnologías relacionadas con él.De hecho, con la fecha anterior enlaces a la Wikipedia, lo único que se dio cuenta de la mala situación de las versiones en español de los artículos originales. No soy un editor de la Wikipedia, pero estoy pensando en dar algo de vuelta a la comunidad y que es un buen lugar para empezar como cualquier.Esperemos que esta no quede como una simple Resolución de Año Nuevo, principalmente porque se trata todavía de diciembre.

¿Asusta, eh?

Cara dura

Supongamos que tenemos una traductora del idioma x al inglés. No es nativa del inglés, pero hemos comprobado que es más difícil tratar con nativos del inglés. No se trata de tenerle manía a una cultura o a un país concreto, ni de abaratar costes. Simplemente, hay menos anglófonos que hablen el idioma x que nativos del idioma x que hablen inglés. Obviamente, la expresión no es tan natural, pero sí tienen una actitud distinta, la de tener ganas de trabajar. Y esto no me lo invento yo, lo dice un cliente inglés nuestro.

En fin, a lo que vamos. Tenemos una traductora del idioma x al inglés con la que no estamos nada contentos, pero no logramos encontrar otra persona que acepte textos tan técnicos en una lengua tan minoritaria. El caso es que estamos investigando la incorporación de la traducción automática a nuestro flujo de trabajo. Que nadie se asuste, no se trata de rebajar la calidad, sino de ahorrar tiempo y esfuerzo (lo que significa abaratar costes, sí). Pues el otro día se nos ocurre, medio en broma, comparar la calidad de Google Translator con las entregas de esta proveedora. Primera sorpresa, la traducción de máquina era de bastante buena calidad. Segunda sorpresa: párrafos enteros exactamente iguales entre uno y otro, en la mayoría de casos con mínimos retoques.

Soy consciente de que la herramienta de Google aprende, ya que es traducción estadística en lugar de basada en reglas y, además, se le pueden sugerir traducciones más correctas para la mejora del sistema. Por lo tanto, ¿sería posible que el huevo no viniera de la gallina, sino la gallina del huevo? Es decir, quizá lo que aparece ahora en Google Translator es lo que puso esta persona en su día. Pues no, Google tarda un poco más en actualizar sus bases de datos. He hecho pruebas, alimentando texto a la maquinita y horas después sigue sin actualizarse. Quod erat demostrandum, que decía mi profesor de lengua.

jueves, 6 de diciembre de 2007

Inauguración

Hola, bienvenidos a esta nueva bitácora sobre tecnologías de la información, de la localización al conocimiento libre. De hecho, el título de la bitácora es un mal juego de palabras con MT-TM, la conjunción de herramientas de traducción automática con traducción asistida. Total, un mal momento de inspiración lo tiene cualquiera.

Soy traductor en una empresa española del sector. Además, soy el responsable técnico de la empresa y la razón de crear este espacio es que en el trabajo apenas tengo tiempo para ponerme al día. Así, me obligo a investigar sobre el mercado de la traducción y las nuevas tecnologías relacionadas con él.

De hecho, al incluir los enlaces anteriores a la Wikipedia, me he dado cuenta del raquítico estado en el que se encuentran las versiones españolas de los artículos originales. No soy editor de la Wikipedia, pero estoy pensado en devolver algo a la comunidad y ése es un buen sitio para empezar.

Esperemos que todo esto no se quede en propósitos de Año nuevo, más que nada porque seguimos en diciembre.