Google, suficientemente bueno (I)

A menudo leo artículos que definen los netbooks como ordenadores "suficientemente buenos". Los netbooks son esos ultraportátiles con una pantalla más pequeña (digamos, entre 9 y 11 pulgadas), con menor capacidad de proceso, pero con mayor eficiencia energética (mayor autonomía) y mejor portabilidad (peso + tamaño). En su día, el diferenciador principal entre los netbooks y los portátiles "de toda la vida" era el precio, pero hoy día esa frontera está desapareciendo y lo que pide el mercado es estar "siempre conectado". Así, los netbooks no son la mejor opción para, digamos, la edición multimedia, pero son "suficientemente buenos" para casi todas las actividades diarias, es decir, Internet. Hemos vuelto a la caja tonta que eran los terminales conectados a un superordenador ("mainframe") que existieron hasta mediados de los 80.

Como demostró Google esta semana en el MWC de Barcelona, la ingeniería lingüística ha alcanzado cotas inimaginables hasta hace un par de años. Decenas de grandes avances se entrelazan para conseguir la caída de la cuarta pared.



La traducción automática (TA) antes se hacía por reglas lingüísticas que hacían que mejorar un motor de traducción fuera una tarea titánica en manos de humanos. Hoy en día, alimentando un motor con enormes corpora lingüísticos sin intervención humana se consiguen resultados mucho mejores y más escalables.

Antiguamente, la TA se ejecutaba en local, en el pobrecito ordenador del usuario, y era necesario ejecutar las mismas rutinas una y otra vez cada vez que se solicitaba la traducción de la misma frase, en el mismo contexto, con la misma combinación de idiomas. Hoy en día, los motores de TA están en la nube, en clústeres de servidores que ya han ejecutado previamente cualquier combinación que se nos ocurra. Cuando hacemos una petición, sólo tienen que recolectar los resultados y servirlos en bandeja. Obviamente, la capacidad de proceso de un clúster es mucho mayor que la de nuestro ordenador doméstico.

Por otra parte, el reconocimiento óptico de caracteres (OCR) permite transformar una serie de puntitos dispersos en caracteres con entidad propia que se pueden procesar digitalmente a posteriori.
De igual manera, la tecnología de reconocimiento de voz permite convertir unas ondas de sonido en caracteres con entidad propia que, una vez más, se pueden procesar digitalmente a posteriori. El proceso inverso permite convertir cadenas de texto digital en ondas de sonido, aunque me imagino que el proceso será menos fácil y escalable en este caso.

Obviamente, Google no se ha sacado de la manga todas estas tecnologías. Detrás de todos estos avances hay muchas universidades, organizaciones con y sin ánimo de lucro, gobiernos, etc. Lo que sí es cierto es que Google ha juntado todos los ingredientes y nos da el cóctel listo para consumir.

En el vídeo anterior se pueden ver algunas de las aplicaciones prácticas de todas estas tecnologías. La cámara del móvil captura una imagen, reconoce los caracteres del texto y presenta una traducción al idioma escogido. El micrófono del móvil permite hacer búsquedas en Internet mediante la voz, cada vez en más idiomas.

Comentarios

Entradas populares de este blog

La posedición: ¿zombificación del traductor?

Impacto de la subida de impuestos (IVA e IRPF) en traductores autónomos

Fuera Academia, dentro la masa: ¿qué puede salir mal?