miércoles, 29 de diciembre de 2010

World Lens: de la realidad aumentada a la singularidad en tres cómodos pasos

Hace un par de semanas la blogosfera se volvió loca por una app de iPhone llamada World Lens. Mi corazoncito de fandroid me hace dudar si se volvió loca porque se trataba de una app para el iPijada, pero eso no importa ahora. Tampoco importa que falle más que una escopeta de feria, lo realmente increíble es que acierte aunque sea de casualidad.

Antes de continuar, un vídeo informativo para ponernos en situación:


Como vemos, World Lens muestra en la pantalla la traducción de un texto respetando su contexto. Esto se dice pronto, pero es poco menos que magia. Repasemos qué procesos tiene que completar esta app para mostrarnos resultados.
En primer lugar, captura una imagen en movimiento y distingue entre texto y su contexto. Google Goggles, que ya cubrí con antelación, solo capta imágenes fijas, además de desprenderlas de su fondo. Después de detectar qué es texto, reconoce los caracteres individuales (OCR). A continuación, pasa el texto reconocido por un motor de traducción automática. Finalmente, y aquí está la gracia, utiliza técnicas de realidad aumentada y disminuida para reemplazar una imagen del mundo real en la pantalla del iPhone.

Este tipo de aplicaciones lingüísticas se basan en la arquitectura de tuberías para cumplir su objetivo. Por ejemplo, la salida (=el producto) de la subaplicación que separa el texto de su fondo, es decir, el texto en sí, es la entrada (=la materia prima) de la subaplicación que reconoce los caracteres individuales del texto. La salida de esta es la entrada de la subaplicación que reconoce oraciones. A su vez, la salida de esta última, es decir, el texto segmentado, se alimenta a la subaplicación que tiene el motor de traducción automática. Para resumir, en una tubería la salida del primero es la entrada del segundo y así sucesivamente. La desventaja intrínseca de las tuberías es que la salida solo puede aspirar a ser tan buena como la entrada, con lo que a menudo la calidad degenera con cada nueva tubería. Es decir, si el texto se reconoce mal, el motor de traducción automática se lía.

Pero, ¿qué es eso de la realidad aumentada y disminuida?

Ejemplo(s) de realidad aumentada:

Ejemplo de realidad disminuida:

Como vemos, la realidad aumentada añade elementos virtuales en una pantalla a una captura en movimiento del mundo real, mientras que la realidad disminuida los elimina en la pantalla. Hay muchas aplicaciones prácticas para la primera: capas de etiquetas con información turística o de servicios para moverse por ciudades, videojuegos con mascotas virtuales (o rol en vivo), libros educativos que saltan de las páginas, diseño industrial o incluso ligar mientras paseas por Shibuya (¡!). La realidad disminuida, una simple variación de la aumentada, es una idea más reciente y todavía no tiene muchas aplicaciones. En cualquier caso, es una tecnología muy versátil, limitada por la imaginación del diseñador y por la adopción de las masas.

Como puede verse en el primer vídeo, la calidad de la traducción en sí es horrible. Sin embargo, la calidad no deja de ser un detalle menor en este caso. La estructura de la aplicación ya está hecha, ahora solo queda mejorar las partes. Tendrán que mejorar la detección de oraciones cuando el texto típico de uso no usa puntos y está en mayúsculas (carteles, anuncios, etc). Si usa un motor de SMT, es cuestión de alimentarlo con más corpora y hacer ajustes en su modelo lingüístico. Es cuestión de tiempo que World Lens (u otra app similar) sea útil de verdad para no perderse haciendo turismo por ahí. Imaginaos una guía turística que integre una guía de conversación / intérprete en tiempo real con un traductor visual de realidad aumentada. Con que fuera "suficientemente bueno" para hacerse entender ya sería toda una revolución. Además, World Lens se ejecuta en local, sin utilizar la potencia ni el almacenamiento de la nube, por lo que podemos viajar tranquilamente con él sin que nos sablen las telefónicas con el roaming de datos.

Como dicen en Global Watchtower, la tecnología de World Lens podría reciclarse para crear un Google Translate más potente que pueda tratar texto "oculto" o "protegido". Por ejemplo, texto dentro de imágenes, de animaciones Flash, de multimedia, etc. Si se puede capturar como imagen, se puede traducir.

Dentro de unos años, la tecnología de World Lens, y de los teléfonos inteligentes en general, podría integrarse en unas gafas cyberpunk megachulas. Nada de gafas cantonas gigantes tipo cine 3D, no. Unas gafas normales y corrientes que se conectan a Internet, reproducen contenido multimedia, son nuestro asistente personal y nos introducen en un mundo de realidad aumentada cuasi real. Y dentro de unos años más, un chip en el cerebro que integrará los cinco sentidos y que nos lo pondrá difícil para distinguir la realidad real de nuestra propia realidad creando un exocórtex del copón y aumentando nuestro wetware hasta límites insospechados. Avanzamos unos años más y podremos subir nuestra conciencia a la nube (la singularidad friki), dejando atrás nuestros anticuados cuerpos de carbono por una existencia más perfecta en un mundo platónico que se amolda a nuestros deseos. ¿Y por qué no? ¿Quién habría pensado hace cincuenta años en las maravillas tecnológicas que hoy damos por sentadas? Como decía Clarke, "Cualquier tecnología lo suficientemente avanzada es indistinguible de la magia".

Va a ser divertido vivir el futuro. Igual me quedo obsoleto como traductor, pero ¿y las maravillas que voy a ver?

jueves, 16 de diciembre de 2010

Intrusismo laboral en el periodismo y por periodistas

Un buen amigo mío es periodista, pero eso no me impide meterme con ese gremio cada vez que surge la ocasión: es divertidísimo. Otro día hablaré de los ingeniosos juegos de palabras, especialmente de los periodistas deportivos, y de los chistes de Matías Prats. Hoy me conformaré con hablar de intrusismo, pero brevemente, que la entrada de ayer me costó muchas neuronas de parir.

Acabo de descubrir vía David Tejera una entrada sobre los anglicismos de reciente introducción: "Cables, agendas y escenarios". Hace unas semanas, cuando empezó el "Cablegate" (descacharrante juego de palabras), oí por primera vez eso de los cables. Y yo pensando, qué diferencia habrá entre eso y un "despacho diplomático", que me suena que es lo mismo que un cable de esos. Lo dejé pasar, porque tenía cosas mejores que hacer. Ahora me ha dado por buscarlo en el DRAE y:
despacho: (6) Comunicación escrita entre el Gobierno de una nación y sus representantes en las potencias extranjeras.
En lo de los "scenarios" (que suelen ser "worst-case") y las "agendas" (que suelen ser "hidden"), ya no entro porque no son nada nuevo. Cualquiera que vea series en V.O. estará harto de encontrarse con estas palabras.

A lo que iba. No sé si a alguien le suena un informe sobre el estado de la profesión del periodista que se publicó el otro día. Ojo a esta perla: "el informe destaca que el intrusismo profesional ha desplazado al paro como principal preocupación". Así que los periodistas se quejan de intrusismo, ¿eh? ¿Y quién deja sin traducir cosas como cables, scenarios y agendas? Me huelo que alguien se está ahorrando unos dinerillos en contratar traductores. Claro, es que inglés sabe todo el mundo, desde el sobrino que ha pasado un verano en Londres hasta el presidente del gobierno. Ay, no, que ese no sabe.

Si insisten en leer documentos en inglés, comprenderlos y transmitir tal información, lo mínimo que podrían hacer es recibir unas clases de "Falsos amigos del inglés para el periodista intrépido". Y cuando crean que lo saben todo y que son los reyes del mambo, que contraten a un traductor para ver hasta dónde han metido la gamba.

Amazon y el increíble caso de la censura incestuosa

¡Toma titular jugosito para atraer visitas!

El mes pasado se montó una buena porque a un señor se le ocurrió publicar una guía de "buena conducta del pedófilo" (The Pedophile’s Guide to Love and Pleasure: A Child-Lover’s Code of Conduct) en la tienda de ebooks de Amazon. La gracia de la autopublicación y de los ebooks está en que no hay editoriales de por medio que te digan qué puede venderse y qué no, de ahí que se saliera con la suya. Amazon en un primer momento defendió la libertad de expresión y se negó a retirar el ebook. Entonces se le echó encima medio Internet. Entonces cedió a la presión, dio marcha atrás y retiró el libro.

Dejando de lado el contenido del libro y las objeciones morales o legales que podamos tener al respecto, quería centrarme en qué pasa cuando se prohíbe algo. Antes de que se anunciara a bombo y platillo la existencia del ebook, el autor solo había venido una copia. Después de que se le echara encima medio Internet, el libro llegó al puesto 80 de los más vendidos en Amazon. No se sabe a cuántos libros equivale esa clasificación ni cuánto dólares sacó el autor, pero digamos que a) muchas copias y b) mucho dinero. Incluso me atrevería a decir que, sin la publicidad gratuita, el autor no podía soñar que su obra tuviera tanta difusión ni sacarse tanta pasta.

Algo parecido pasó con Saw VI y A Serbian Film, dos películas que no se me ocurriría ver bajo ningún concepto, pero que mucha gente ha buscado como locos después de que se prohibiera su distribución en España y otros países. Ni que decir tiene que más de uno se ha arrepentido de dejarse llevar por el morbo y le ha hecho falta una buena dosis de unicornios y arco iris para lavarse los ojos y poder dormir sin pesadillas.

Anteriormente Amazon saltó a la palestra por borrar más de 57.000 libros (en papel) de temática gay de su catálogo. Se montó la de dios es cristo y pidieron disculpas. Al parecer, fue un fallo técnico de los que yo llamo "el perro se ha meado en los cables". Vamos, que no tenían mala intención.

A lo que iba. Hace unos días a Amazon le dio por retirar novelas autopublicadas que tratan de forma explícita el incesto, es decir, relaciones sexuales intrafamiliares. Dejando de lado por un momento la legalidad o moralidad del asunto, el caso es que:
  • no especifican con antelación qué hace que un libro no sea publicable (en ningún momento las "publishing guidelines" suyas mencionan la palabra "incesto")
  • no informan a la autora del borrado con antelación, ni con posteridad, ni le dan posibilidad de defenderse
  • no aclaran a la autora la razón del borrado
  • no ofrecen automáticamente la devolución del dinero a sus clientes
Después de que muchos bloggers pusieran el grito en el cielo porque a los usuarios no les dejaban volver a descargar los ebooks que habían comprado, Amazon ha reculado en parte y permite volver a descargar los libros a quienes ya los tenían comprados. Una vez más, citan un fallo técnico en lugar de un fallo en su política. El caso es que Amazon no vuelve a poner a la venta los libros ya retirados.

Me ha dado por hacer un poco el troll y enviar lo siguiente a Amazon:
I read that Amazon is deleting ebooks with incest in it, such as Wicked Lovely by Jess C. Scott (previous ASIN B003VIWUXS).
I would like to take this opportunity to inform you that you are carrying ebooks with even stronger themes, such as double incest (father laying with two daughters) and rape incest (brother against sister). These characters are Lot and his daughters, and Amnon and Thamar and their crimes appear in the many editions of a book called The Holy Bible (ASIN B001EOCFU4, B0032UYGE6, B002920ZOS, among others).
I hope you remain committed to keeping the Kindle Store safe for our children and ban these ebooks as well. Thank you.
¿Es posible que alguien no vea la mala leche y el sarcasmo que destila lo anterior? ¿A que no? Pues van y me contestan esto:
Thanks for your suggestion about deleting books with incest in it. Customer feedback like yours is very important in helping us continue to improve our website and services. I appreciate your thoughts, and I'll be sure to pass your suggestion along.
Thanks again for your feedback.
¿Me están ignorando? ¿No se enteran? ¿Es posible que haya empeorado la situación?

Para rematar la faena, y dejando a Amazon tranquila un momento, el otro día modificaron las leyes de publicación de manga y anime en Tokio. En concreto, prohíben la publicación / difusión de cualquier obra que "glorifique o enfatice injustificadamente determinados actos de naturaleza sexual que violen las normas sociales". ¿Y cómo definen los tokiotas las normas sociales? Pues dependerá de cada uno, digo yo. Además, igual lo que entiende como socialmente aceptable el gobernador de Tokio, el muy deleznable Ishihara-san (pinchad y flipad con el pájaro), no es lo que entendemos los demás. Entre otras lindezas, ha dicho que las mujeres con menopausia son inútiles y que los gays son anormales, le pareció "lamentable" una cabalgata gay que presenció en en San Francisco y negó la masacre y violaciones sistemáticas del Imperio Nipón en Nankín, China (lectura no agradable). Pero no caigamos en juicios ad hominem, por mucho que se los merezca. El caso es que si se prohíbe la distribución de un manga / anime en Tokio, se condena la obra a la extinción porque el mercado tokiota es imprescindible para la industria.

Nótese que en ningún momento he entrado a valorar el contenido de lo que se censura. Pero me voy a mojar. Creo que hay que distinguir entre los crímenes de pensamiento (crimethink, que decía Orwell) y los crímenes factuales. La ficción, siempre que no la representen personas de carne y hueso, está protegida por la libertad de expresión. Eso incluye texto, dibujitos e infografía. Otra cosa es la imagen real, sea con actores o no, sea consentida o no. Ahí ya podemos discutir qué vale y qué no.

martes, 14 de diciembre de 2010

Trata a tus clientes como ladrones y te quedarás sin clientes

Cada vez veo menos tele, prefiero Internet TV. Por ejemplo, si quiero ver un capítulo de Doctor Mateo (sí, qué pasa, yo también tengo un lado marujo) en línea, me trago menos de 4 minutos de publicidad en una hora de capítulo. No he contado cuánta publicidad me trago si lo veo en directo en la tele, pero seguro que un pelín más.
La semana pasada me sorprendí cuando, aparte de la publicidad en los cortes y la publicidad muy poco encubierta ("ay, nena, ¿y esa mantequilla?"), me metían propaganda durante el capítulo. Propaganda no de la de vender, sino de la de comer la cabeza. "Con la piratería muere la cultura. Gracias por ver este capítulo legalmente".
Captura de Antena3 - Doctor Mateo
Qué curioso. Si me bajo el capítulo pirateado (en el buen sentido de la palabra), me evito cortes publicitarios, por cortos que sean, y que me den una palmadita en la espalda, bien hecho, chaval. En este caso, no me bajo el capítulo pirateado porque la experiencia de consumo es suficientemente cómoda. Pero no me ha hecho mucha gracia el cartelito.

Me ha recordado a la propaganda que meten en los DVDs o en los cines. Que si el FBI te está vigilando, que si prohibido la difusión pública sin permiso del distribuidor, que vigila no vaya a haber alguien grabando con el móvil, etc. Propaganda que, por otra parte, me evito si opto por piratear la peli de turno. Castigas a tus clientes y "premias" a los que no lo son. No parece un modelo de negocio con mucho futuro, sinceramente.

Para acabar, quería insertar un vídeo de YouTube con una parodia que hicieron los chicos de The IT Crowd ("Los informáticos" en España) sobre el famoso anuncio "no le robarías el bolso a una vieja, no robarías un coche". En un súbito ataque de ironía poética, resulta que el vídeo no se puede ver fuera de YouTube, así que no lo puedo insertar. No os lo perdáis, es buenísimo.

Si no conocéis la serie, viene a ser una The Big Bang Theory con humor inglés más refinado. Ya estáis bajándola comprando la maravillosa edición especial megafriki en DVD.

domingo, 12 de diciembre de 2010

Redes sociales y Goodreads como biblioteca personal virtual

Redes sociales
No soy muy amigo de las redes sociales. Corrijo. No soy muy amigo de socializar, valga la tautología. En el instituto mis compañeros pasaban los recreos jugando al fútbol. O al baloncesto, cuando no quedaba más remedio. Yo pasaba los recreos bajo un árbol con un buen libro. Lo más friki que hice, esto ya a los 16 años, fue leer la Divina comedia de Dante en las pausas del recreo. Hasta entonces era "el rarito", pero a partir de ese momento pasé a ser el sociópata del cole. Buenos tiempos.

El caso es que tengo cierta resistencia a las redes sociales. Hasta septiembre de 2009 no estuve en Facebook: solo me rendí por irme a estudiar al extranjero y queer estar en contacto con los amigos. Llevo en Internet desde 1997 y por aquel entonces estaban de moda los foros. Al ser un quejica, siempre me han gustado los foros: me entretiene discutir por cualquier chorrada. Y los foros, al girar en torno a un tema concreto, me parecen perfectos para hablar de esos temas u otros relacionados. Otra cosa es ser "amigo" de gente que casi no conoces, que preferirías no conocer, o incluso olvidar, y ver sus chorradas, y sus paranoias, y sus fotos de fiesta loca. "Eres más falso que un amigo de Facebook", que dicen por ahí.

Por lo tanto, cada vez que hay una red social nueva que es lo más y en la que hay que estar, me entra una pereza increíble. Y ahí suele estar Manu Viciano para dar la tabarra hasta que pico. Eso fue lo que pasó con Anobii, una red social de libros creada en Hong Kong y en la que hay una fuerte presencia española e italiana.

Libros sociales
Una red social para libros (y para pelis, música, videojuegos, etc) tiene dos vertientes principales: el catálogo y la interacción entre usuarios. Cuando añades libros a tus estanterías, te vas creando una biblioteca. Con esa biblioteca puedes saber cuántos libros leíste en un periodo de tiempo dado. Además, si les añades etiquetas, puedes saber cuántos te gustaron, cuántos eran en un idioma concreto, de qué género o de qué formato (ebooks vs libros en papel, p.ej.). Para eso están los metadatos y las etiquetas, para filtrar y hacer consultas avanzadas. Además, esta biblioteca virtual es muy útil como referencia personal, para tener apuntados qué libros del autor X has leído y si te gustaron. Es vital para no perder la pista a los ebooks que vas leyendo, además de para no echar en falta las cubiertas de tus estanterías en el paso a lo digital.
Al ir creciendo tu biblioteca y hacer cosas que atraigan atención (calificar libros, publicar reseñas, participar en foros), otros usuarios se darán cuenta de que existes. Verán tu perfil y comprobarán su compatibilidad contigo automáticamente y, si les caes bien, seguirán tus actualizaciones o se harán tus amigos. Y lo mismo tú, claro. Es una forma de recibir recomendaciones personalizadas y humanas. Vamos, como Amazon y su "si te gusta este, te gustará el otro, compra, maldito, compra", pero sin algoritmos. También lo utilizo para "libros que quiero leer", aunque ya he pasado de 100 libros futuribles y es un descontrol total, jeje.

Comparativa de redes sociales bibliófilas
Sin entrar en muchos detalles, estuve unos meses en Anobii hasta que me exasperé de la falta de desarrollo y mantenimiento. Tiene muchas carencias y va lento de narices. Así que me puse a buscar una alternativa.

Anobii:
A favor:

  • fuerte presencia de españoles
  • gran catálogo de libros en español y catalán
  • separación entre libros que tienes y libros que querrías tener (wishlist)

En contra:

  • lento
  • desarrollo en punto muerto
  • muy lento


Shelfari:
A favor:

  • comprado por Amazon
  • diseño muy chulo
  • ¿futura integración en ecosistema Kindle?

En contra:



weRead: no lo he visto a fondo, pero parece el menos desarrollado de todos

LibraryThing:
A favor:

  • gran catálogo de libros en inglés
  • muchas funciones
  • comunidad muy involucrada

En contra:

  • diseño poco atractivo
  • demasiadas funciones
  • un único pago de 25 USD, lo cual no es un problema para mí, pero hace que muchos lo descarten


Goodreads:
A favor:

  • widgets muy personalizables
  • muchos metadatos (optativos, casi todos)
  • buen equilibrio entre funciones y diseño
  • agrupación de ediciones (y traducciones) en torno a una obra única
  • chorraditas como boletines tipo club de lectura y trivial literario
  • comunidad muy involucrada

En contra:

  • Pocos usuarios españoles
  • Escaso catálogo en español
  • La agrupación suele poner una edición en inglés como "primaria", aunque se escribiera en otro idioma

Comparativas que me ayudaron a escoger:
http://www.bloggingtips.com/2010/09/18/5-rewarding-social-networks-for-book-lovers/
http://jameswharris.wordpress.com/2010/02/08/librarything-goodreads-shelfari-google-books-anobii-weread/
http://www.youthservicescorner.com/2010/goodreads-vs-librarything-vs-shelfari/
http://www.danahuff.net/?p=1607

Mudanzas
Cambiar de red social tiene dos inconvenientes: los amigos que te dejas y la migración de datos. En lo primero, o les convences para que se pasen, o mantienes las dos redes actualizadas. Lo segundo no lo pienso hacer, así que David, haz el favor de migrarte los libros a Goodreads. :D
En el caso de redes como Facebook, la migración de datos no es tan relevante. Vuelves a actualizar tu perfil, subes las fotos necesarias y empiezas de nuevo. Pero las redes sociales basadas en catálogos tienen un componente de datos muy importante: tu biblioteca personal.
Seguí este tuto para migrar mis estanterías de Anobii a Goodreads. Siguiendo las instrucciones, se pueden mantener la mayoría de los metadatos importantes de cada libro siempre que ese libro de Anobii exista en Goodreads, es decir, que el ISBN (ISBN-10 o ISBN-13) esté en las dos redes. Si el libro no está, no se puede importar, con lo que hay que introducir el registro a mano en Goodreads (crowdsourcing, sí), sumar la edición concreta a la obra principal (si corresponde) y finalmente añadir el libro a nuestra biblioteca. Para agregar libros y editar metadatos de los libros, hay que solicitar ser bibliotecario, una responsabilidad que no hay que tomar a la ligera. Ya se sabe, un gran poder...

Conclusión
Espero que este rollo increíble que acabo de soltar anime a alguien a ponerse con una red social para libros, a poder ser Goodreads. Y para que os entre el gusanillo, mirad qué widget más chulo he puesto a la derecha: muestra los libros que estoy leyendo actualmente, aunque también podría mostrar los que he leído o cualquier otra categoría que prefiera. A mis contactos de Facebook (y Twitter, si tuviera) los atormento con actualizaciones de los libros leídos que acabo de leer, con sus notas y sus críticas.

viernes, 10 de diciembre de 2010

CT3: Traducción comunitaria, colaborativa y crowdsourcing (I)

La traducción no remunerada se conoce indistintamente como traducción comunitaria, colaborativa o crowdsourcing o, como prefiere la Common Sense Advisory, "CT3". Crowdsourcing viene de "outsourcing", es decir, que un externo haga parte del trabajo de una entidad, ya sea esta una empresa, la administración pública, o incluso autónomos. Mientras "outsourcing" (o "subcontratación", en cristiano) supone que el externo persigue su beneficio económico en primer lugar, crowdsourcing (o CT3) se refiere a que el externo busca el éxito del proyecto como primer objetivo.
Para ciertos proyectos sería más recomendable contratar a un profesional. Por ejemplo, ciertos textos tienen requisitos técnicos de localización muy altos. En el caso de los textos legales, podrían ser temas confidenciales, textos vinculantes o asuntos que no deben conocerse antes de tiempo, como las fusiones entre empresas, por ejemplo.
Por otra parte, para que la comunidad acepte regalar su tiempo y experiencia, debe tratarse de una empresa que les cause simpatía y, a poder ser, que ofrezca servicios gratuitos o devuelva algo a la comunidad. Un gobierno lo tiene difícil para solicitar trabajo no remunerado, ya que entre sus funciones se incluye fomentar el empleo. Probablemente las ONGs pueden cubrir esta función de traducción gratuita por el bien común mejor que un gobierno. A parte de la traducción para empresas sin ánimo de lucro, la CT3 también puede ser por la comunidad y para la comunidad. Por ejemplo, un proyecto de software libre como GNU/Linux o de cultura libre como la Wikipedia.
De todas formas, la CT3 entendida como "traducción colaborativa" no tiene por qué ser traducción no remunerada, ya que también tiene cabida la traducción profesional. Por ejemplo, varios traductores que colaboran en tiempo real en un macroproyecto con la misma memoria de traducción, añadiendo términos al glosario según los encuentran, comentando problemas de traducción específicos o ambiguedades en la guía de estilo, etc.

(Este artículo y los siguientes del mismo tema están adaptados partiendo de un apartado de mi tesina. El crowdsourcing será el último tema que trate al respecto.)

Tesina acabada y movimiento

Hace un par de meses comenté que estaba escribiendo una tesina para finiquitar el máster. Afortunadamente, ya la acabé y entregué hace un par de semanas. Aunque el resultado final no me convenció demasiado, era cuestión de entregarla ya o hundirme en la desesperación unos cuantos meses. Desde luego, la investigación no es para mí. ¡Qué tortura!

En principio no tengo que hacer nada más al respecto, no tengo que presentarla en persona, ni defenderla, ni nada. Después de revisarla, me han dicho que les ha gustado mucho, que trato temas muy interesantes y se nota que sé de lo que hablo, pero que me salto unas cuantas normas de la investigación y que soy algo rácano en conclusiones. Pero vamos, que en general está muy bien, jeje. Más o menos es la crítica que me esperaba.

Bueno, después del desgaste de neuronas de los últimos meses y de una catarsis en forma de gastrointeritis rara, vuelvo con fuerzas renovadas. En los próximos días publicaré unos cuantos artículos más sobre el crowdsourcing, que es uno de los temas que he tocado de refilón en la tesina, y ya no insisto más con el tema. Si la calificación final, que en teoría debe ser a principios de año, no acaba en sorpresa desagradable, publicaré la tesina por aquí por si a alguien le va el masoqusimo alguien está interesado en el tema de la traducción y el software libre.

Además del rollo de la tesina tengo unos cuantos temas interesantes en cola: algo de traducción, algo de tecnología y algo de cultura. Los iré sacando entre esta semana y la siguiente. ¡Esto se anima!

sábado, 30 de octubre de 2010

Fansubs, piratería y voluntariado

Ana de Analizando la traducción ha publicado un artículo sobre la legalidad de los fansubs y la traducción como forma de ganarse la vida o como forma de transmitir cultura. Tengo que añadir unos cuantos blogs que he descubierto recientemente a mi blogroll y éste será uno de ellos. Siempre es agradable encontrar traductores frikis como yo.

Como actual traductor, antiguo fansubber de miniseries de Terry Pratchett y consumidor de fansubs y scanlations, el tema me toca de cerca.

Antes de empezar, aclaro dos conceptos. Fansub es la traducción, subtitulación y distribución de subtítulos por fans y para fans sin ánimo de lucro. Puede incluir la digitalización y distribución del material audiovisual o sólo el texto de los subtítulos. Scanlation es el escaneo, traducción, maquetación y distribución de cómics por fans y para fans sin ánimo de lucro.

La traducción ES una modificación del original, eso que quede claro. Las obras con licencia Creative Commons tienen una etiqueta opcional llamada "nd" ("No Derivatives"), la cual prohíbe tanto la reutilización de personajes y tramas como las remezclas y las traducciones. En contraposición a la by-nc-nd, que no permite obras derivadas, Creative Commons define la licencia by-nc-sa, que sí las permite, tal que así: "Others can download and redistribute your work just like the by-nc-nd license, but they can also translate, make remixes, and produce new stories based on your work." Pero éste es un punto menor, ya que las obras de las que hablamos tienen copyright, no copyleft.

La libre distribución por Internet de material con derechos de autor (=piratería sin ánimo de lucro) es una espada de dosble filo. Por una parte, permite acercar al gran público una obra previamente desconocida. Esto crea interés y hace que una editorial o distribuidora se anime a sacar el producto en el territorio. Por la otra, cuando ya se distribuye comercialmente esa obra, ésta tiene que competir con la piratería sin ánimo de lucro en desigualdad de condiciones. Una es gratis y va al día, mientras que la otra se paga (y se paga bien) y va atrasada. Esto pasa con series americanas, con anime de TV, con pelis, con cómics e incluso con novelas. Dadas las limitaciones del formato, estos dos últimos no le arañan demasiado mercado a la distribución oficial (todavía), pero en los casos anteriores todo son ventajas sobre la distribución comercial.

N. del T.: Juego de palabras intraducible
Ciertos grupos de fansubbers cortan su trabajo en una serie (o grupos de scanlators paran de trabajar en un cómic) cuyos derechos ha adquirido una distribuidora comercial. Por lo que decía antes de competir en desigualdad de condiciones, vamos. Esta actitud les honra, pero son los menos y de poco sirve. La mayoría de grupos siguen con su trabajo alegremente. Los fans se quejan de los grupos que han abandonado una serie a favor de la distribución comercial y el resultado es que otros grupos retoman el trabajo desde donde se quedó ese grupo. Es normal, imagínate que estás en el volumen 30 de un manga, cuya traducción se paraliza porque una distribuidora ha adquirido sus derechos, y te toca esperar... (30 volúmenes / 12 meses) un mínimo de 6 años para continuar con la historia. Es la grandeza de Internet, la aparente anarquía que se auto organiza.

Las cadenas de televisión, y sobre todo Cuatro, se han adaptado a esta carrera en desigualdad de condiciones. Si hoy echan un capítulo de House M.D. en EEUU y mañana te lo puedes descargar subtitulado al español, ¿para qué vas a esperar meses a que llegue a tu país? Hoy en día no se habla de meses. Se habla de semanas para la versión doblada y de días para la versión subtitulada oficialmente. Con la final de Lost la subtitulación comercial llegó al nivel de los fansubs, aunque la emisión no estuviera libre de errores. En muchos casos, preferimos ver la VO, o la VOSE, al día siguiente en lugar de esperar a que llegue a la tele. El resultado es que la ficción extranjera cada día tiene menos cabida en la tele española. En su lugar, triunfan los programas de producción propia, a ser posible chorras. Ahí están los Sálvame y demás bazofia; ahí están los datos de audiencia de Cuatro y la Sexta, que apuestan por la ficción extranjera, comparados con los datos de Telecinco y Antena 3, que apuestan por los cotilleos nacionales. De todo esto somos parcialmente responsables, dejando de lado por un momento la pasión nacional por los cotilleos de portería y el marujismo generalizado.

Tengo una camiseta  muy chula tal que así
Que conste que no estoy intentando dar lecciones morales a nadie. Tal y como está concebida la propiedad intelectual, estoy totalmente a favor de la piratería. No quiero comprar DVDs, ni ver la tele, ni comprar cómics o libros. Quiero comprar versiones digitales (los productos físicos que ocupan sitio) de estos productos a un precio justo y con unas condiciones favorables al consumidor. Alternativamente, puedo aceptar el alquiler (compra con DRM o subscripción) si el precio es ridículamente bajo. Mientras me sigan tomando el pelo, conmigo que no cuenten.

Por otra parte está el tema de la remuneración económica de los que participan en el proceso de libre distribución del producto, específicamente del traductor. Yo trabajé unos meses de profesor de español para Cruz Roja, con resultados desastrosos, todo sea dicho. He participado en proyectos colaborativos de traducción de software libre o, al menos, gratuito. He traducido y subtitulado tres miniseries de Terry Pratchett. A menudo traduzco artículos para el Ankh-Morpork Times / El Puercoespín. He maquetado ebooks en formato PDF chungo a formato ePUB (un estándar de ebooks) y los he distribuido para que otros se eviten el curro. Todo esto, sin cobrar un duro y a menudo sin que nadie me lo pidiera. ¿Por qué? Para devolver a la gran comunidad que es Internet una parte infinitesimal de lo que me ha dado. En todos los casos, he trabajado en y distruido material que no estaba disponible en digital de forma comercial. Y sigue sin estarlo.

Lo mismo se aplica con el voluntariado de traducción para Traductores sin fronteras y la Fundación Rosetta: al igual que médicos, ingenieros, bomberos, etc regalan su trabajo a ONGs, los traductores podemos elegir regalar horas de nuestro tiempo.

jueves, 14 de octubre de 2010

Aeropuerto de León busca traductor de lengua exótica: inglés

Quim Monzó publicaba ayer en La Vanguardia una columna de opinión sobre Ryanair y su carismático jefe. No me apetece meterme con Ryanair, para eso ya sobra gente. Lo que me llama la atención es el enlace a Leonoticias, donde se menciona un caso esperpéntico de nuestra España valleinclanesca. Parece ser que desde el aeropuerto de León llegaron a un preacuerdo con Ryanair para ofrecer vuelos internacionales, comunicando León con "Bruselas, Frankfurt, Milán, Bolonia y Gerona (para enlaces a líneas internacionales)". En la columna de La Vanguardia, el autor, quizá sin mala intención, quizá con ganas de armarla, quita el paréntesis de la cita anterior, de forma que parece que el trayecto León-Girona sea un vuelo internacional.
En cualquier caso, la gracia del asunto está en que, desde que se fue el responsable de expandir horizontes del aeropuerto en 2009, ese precontrato con Ryanair se ha quedado en un cajón, olvidado. ¿La razón? "El problema es que el precontraro está en inglés y aquí nadie sabe inglés". ¡TOMA! Más allá de que en un aeropuerto que quiere ser internacional, nadie hable inglés, ¿qué pasa? ¿Que en León no hay traductores? ¿Que no pueden robarle Internet al vecino para subcontratar la traducción? ¿No tienen vuelos con Madrid, para que vaya un traductor de la capital?
Esto es un esperpento en toda regla. Es la España de dos velocidades: la real y la de fantasía. La de los ciudadanos de a pie por un lado y los grandes empresarios y políticos por otra. Humo y espejos.
Ya que la excusa del inglés en León me ha dado para soltar una buena perorata, no quería dejar de mencionar la fiebre por las infraestructuras. ¿Para qué quieres un aeropuerto en Lleida, en León o en Castellón? No creo que valga la pena el gasto en construirlo y mantenerlo con el volumen de pasajeros que lo van a visitar. Están condenados a ser aeropuertos de tercera regional.
¿Para qué quieres un AVE a Albacete o a Cuenca, por muy bonitas que sean sus casas colgantes? Son sólo dos ejemplos, hay muchos más: Cantabria (con Mr. Anchoas), Valladolid, etc. "Es que como está de paso, ya que se ponen, no cuesta nada hacer una estación." Hombre, hacer una estación cuesta, y si ya está hecha igual hay que adaptarla, y luego hay que mantenerla si es exclusiva para el AVE. Además, la gracia de un tren como el AVE es que va más rápido cuanto menos pare. (Los AVE a Alicante y Valencia los entiendo, así los madrileños ya pueden decir que tienen playa. Y no lo digo por interés personal, que yo prefiero los EuroMed y demás, que van suficientemente rápido y son más baratos.) Y ya que estamos, ¿por qué todos los AVEs tienen como origen o destino Madrid? Ah, la España radial, claro. Pero no, es mejor que el cuñado pegue un pelotazo vendiendo a precio de oro los terrenitos donde, qué casualidad, se construye la estación. Y ya que estás, haces una promoción de viviendas al lado, que es muy cómodo tener el AVE enfrente de casa.

Soy de Benidorm, y aquí hasta hace unos cinco años no teníamos estación de autobuses. Increíble pero cierto: sólo había una parada en medio del pueblo donde se formaban unos atascos de aúpa, con una hilera de autobuses en doble fila. Entonces decidieron hacer una estación maravillosa (prometida desde hace veinte años) y extra king size a la entrada del pueblo, con hotel, galerías comerciales y Mercadona. Hace un par de años todas las tiendas cerraron, porque no iba ni el tato, y ahora sólo queda el Mercadona abierto. El hotel creo que no llegó a abrir porque les faltaba no sé qué permiso. A la estación en sí también le faltaban unos cuantos permisos, pero fueron tirando mientras llegaban, que unos permisos de nada nunca han parado a nadie en esta Santa Comunidad Valenciana. ¿Por qué se hizo tal construcción faraónica y totalmente innecesaria? Alguien se llevaría un pelotazo, pero desde luego no fue el pueblo, ni sus ciudadanos.
Aquí tenemos tren, lo llaman Tram (hijo bastardo entre el tren y el tranvía) y va de Alicante a Benidorm y de Benidorm a Denia, a velocidad de tortuga coja porque para, no ya en todos los pueblos, sino en todos los barrios por los que pasa. Lo que nos vendría bien es un Cercanías o un Regional que conectara Alicante con Valencia por la costa (el corredor mediterráneo, lo llaman). Hace la tira de años que lo prometen y dicen que lo están estudiando. Mi padre suele bromear diciendo que no vivirá para verlo, y yo le contesto muy serio que yo tampoco.
Plano y paradas del TRAM Alicante-Denia
Ayer oí que España superará en breve en kilómetros de tren de alta velocidad a Alemania y a Francia, quedándonos los segundos por detrás de China. Yo, sinceramente, preferiría que se preocuparan de enlazar los pueblos con las ciudades con Cercanías y Regionales. Por ejemplo, ponme un Cercanías de Benidorm a Alicante o Valencia (que pare en el aeropuerto, porfaplís) y allí ya me cojo un vuelo internacional, o un tren de largo recorrido a Madrid o Barcelona. Pero no, queda más espectacular y la foto sale más mona si el President Montilla sale inaugurando el nuevo aeropuerto, aunque esté vacío y no se use.

Comitiva de autoridades inaugurando el aeropuerto de Lleida
Para acabar, dos enlaces a medios de la maligna PRISA: el reportaje de Cuatro "¿Era necesario construirlo?" y el artículo de El País "Viva la infraestructura (haga falta o no)".

lunes, 4 de octubre de 2010

Estándares (III)


Personalización
En ocasiones los estándares abiertos permiten un nivel de personalización peligrosamente alto, ya que esto puede llevar a la desintegración y atomización del estándar. Por ejemplo, XLIFF 1.2 permite la creación de metadatos personalizados en ciertos campos. Aunque la creación de campos personalizados por desarrolladores de herramientas y diseñadores de procesos pueda ser positiva cara a evitar el uso de estándares propietarios, esta personalización lleva a incompatibilidades entre las distintas implementaciones, y a la pérdida o corrupción de datos intercambiados entre soluciones. Al ser la compatibilidad e interoperabilidad el objetivo primero de los estándares, la posibilidad de personalización parece incompatible con la idea de utilizar estándares.


Complejidad
A pesar de que los estándares abiertos permitan cierto nivel de personalización, los diseñadores intentan evitarla hinchando los estándares con demasiados metadatos innecesarios. Por ejemplo, la especificación XLIFF 1.2 permite hasta 10 estados de traducción, sin contar la infinita personalización: "final, necesita-adaptación, necesita-l10n, necesita-revisión-adaptación, necesita-revisión-l10n, necesita-revisión-traducción, necesita-traducción, nuevo, aprobado, traducido". Aunque ciertos usuarios necesiten todavía más estados, la mayoría de traductores y, especialmente, gestores de proyecto, tendrían suficiente con una lista mucho más reducida, como "sin traducir", "traducido", "revisado", "necesita revisión" y “final”. Incluso alguien con una visión más pragmática podría argumentar que un estado binario es más que suficiente: o una unidad de traducción está completada o no.
El problema con un nivel tan alto de complejidad reside en el hecho de que, mientras el estándar XLIFF permite estos metadatos, la mayoría de herramientas de localización que dicen ser "compatibles con XLIFF" o no soportan metadatos opcionales o simplemente no implementan la interfaz de usuario necesaria para editar estos metadatos. Por ejemplo, Maxprograms Swordfish es la única herramienta comercial que permite a los usuarios cambiar entre todos los estados posibles. La mayoría de herramientas o bien no van más allá del estado binario antes mencionado o sólo permiten un número de estados que creen "suficientemente bueno". Si un archivo XLIFF cargado de muchos estados de traducción se importa en una herramienta con compatibilidad parcial de la especificación XLIFF 1.2, éstos estados se perderán o no se actualizarán al exportar de vuelta el archivo XLIFF. Todo esto lleva a la pérdida de (meta)datos y a perder el principio de interoperabilidad propio de los estándares.


Interoperabilidad
Como se ha mencionado antes, la interoperabilidad entre procesos es la razón de ser principal de los estándares abiertos. Sin una buena interoperabilidad, los usuarios acaban cansados de perder datos y estar atados a un solo proveedor, además de que los desarrolladores tienen que perder el tiempo reinventar la rueda cada vez que crean su formato propio (y propietario) de trabajo.
Un ejemplo de tal interoperabilidad son las Interfaces de plataforma de aplicación (APIs), que permiten a los sistemas intercambiar datos y solicitudes. Por ejemplo, Google ofrece su servicio Google Translate a terceros mediante su API que hace que cualquier pagina web se traduzca de forma automática con un simple clic, gracias a lo cual muchas herramientas de traducción permiten enviar frases individuales a Google Translate y recuperarlas traducidas sin necesidad de establecer procesos más manuales.
La integración entre distintos proyectos de localización también puede realizarse compartiendo un glosario o una memoria, con la importación o exportación de archivos y con solicitudes u ofertas de actividad. Además, el uso de librerías comunes como gettext (extracción de datos de localización) o translate-toolkit (pre y post-procesamiento de archivos) reduce la duplicacion de esfuerzos y proporciona una experiencia común.
En el caso del contenido en línea, los plugins de los Sistemas de gestión de contenido (CMSs) permiten el intercambio de datos entre distintas soluciones (migración), pero también la exportación de contenidos específicos para ser localizados, ya sea con archivos accesibles offline o como datos mediante APIs. En este caso, es vital conectar el CMS a un Sistema de gestión de traducción (TMS), y así intercambiar los datos de localización en las dos direcciones, como pedidos de traducción y como entregas ya completadas.



(Ésta es la tercera de mis entradas relacionadas con mi tesina del máster. Queda una más sobre estándares y ya cambio de tercio. Como veis, no valgo para investigador. Y no es falsa modestia.)

sábado, 2 de octubre de 2010

Estándares (II)

Estándares abiertos y estándares propietarios
Aunque muchas herramientas de localización comerciales anuncian a bombo y platillo que son compatibles con estándares abiertos, da la impresión de que esta compatibilidad sea algo secundario a sus soluciones propietarias. Por ejemplo, la compatibilidad con TMX en las soluciones de SDL Trados ha sido muy incompleta hasta hace poco, con pérdida o corrupción de datos al convertir una memoria a TMX y después importarla de nuevo a una memoria. Por otra parte, un viaje de ida y vuelta (exportación e importación) usando el formato interno de memorias de Trados solía completarse sin errores.
Los desarrolladores de herramientas de localización prefieren sus propios estándares, ya que los controlan y pueden actualizarlos más fácilmente siempre que lo requieran en lugar de esperar a que un organismo independiente debata, implemente y apruebe los cambios a la especificación. Sin embargo, la aplicación de estándares propietarios por parte de los desarrolladores de herramientas desemboca en mantener al cliente prisionero de una solución o servicio, ya que éste se lo piensa dos veces antes de cambiar de proveedor por la posibilidad de pérdida o corrupción de metadatos en el proceso de migración.

Metadatos
La información almacenada en formatos de archivo se organiza y cataloga mediante los metadatos. Metadatos, como el mismo nombre indica, son datos que "hablan" sobre sí mismos. Por ejemplo, unos metadatos básicos especificarían el nombre del estándar, la revisión y la codificación del texto. Estos suelen aparecer en el encabezado de cualquier estándar compatible con XML. Según la información y los objetivos que persigue el estándar, otros metadatos pueden especificar el idioma, país y otras variaciones (locale) del archivo entero, de campos de texto específicos, etc. También puede especificar las fechas de creación y revisión de un campo, o el autor de cualquiera de éstos, algo especialmente útil en el control de versionado y en la automatización del mantenimiento. Otra información puede incluir comentarios, referencias a archivos externos o URIs (webs, carpetas en red), como bases de datos de terminología, memorias de traducción, reglas de segmentación de texto, traducciones de otros idiomas o frases similares, etc.

Usos de los metadatos
Los metadatos están especialmente destinados al filtrado y a la minería de datos. Por ejemplo, un proyecto de mantenimiento de memorias de traducción podría necesitar revisar todas las entradas creadas o modificadas por un editor específico. Un gestor de proyectos de traducción podría necesitar separar entradas en dos grupos: las que tienen un porcentaje alto de coincidencia (digamos del 90% en adelante) con la memoria de traducción (MT) y el resto. Ambas tareas no tienen mayor complicación, ya que estos metadatos están previstos en los estándares TMX y XLIFF. Aunque las herramientas de traducción empleadas no puedan realizar estas tareas por sí mismas, siempre podemos recurrir a escribir expresiones regulares de búsqueda y reemplazo para extraer o destacar los campos requeridos.

(Ésta es la segunda de mis entradas relacionadas con mi tesina del máster. Queda una más sobre estándares y ya cambio de tercio. Como veis, no valgo para investigador. Y no es falsa modestia.)

jueves, 30 de septiembre de 2010

Estándares (I)

Estándares
En el campo de las Tecnologías de la información y la comunicación (TIC), los estándares permiten a las aplicaciones y a los procesos intercambiar datos y trabajar de forma más eficiente. Los estándares cerrados y propietarios suelen estar controlados por instituciones privadas que pueden optar por no compartir información sobre la definición y estructura de estos estándares, lo que dificulta la integración y compatibilidad con productos de terceros. Aunque la definición de un estándar cerrado esté disponible, de forma que éste pueda implementarse por terceros, sigue siendo un estándar cerrado porque sólo la institución que lo controla tiene el poder para actualizar el estándar. Al permanecer el control en manos del desarrollador original, éste puede cancelar la licencia de uso del estándar a terceros, con lo que dejaría en una mala situación a éstos.
Un estándar 100% abierto no sólo comparte su definición y estructura con la comunidad, sino que también permite su libre implementación. Un organismo independiente que desarrolla, mantiene y promueve un estándar abierto agradece la participación y el debate con terceros.
Dos estándares habituales para el procesamiento de texto son Microsoft Office XML (DOCX) y OpenDocument Format (ODT). Aunque ambos están certificados por la prestigiosa ISO, y la definición completa y su estructura están disponibles para facilitar la libre implementación, no son igualmente "abiertos". El primero está desarrollado, mantenido y promovido por la multinacional Microsoft, mientras que el segundo procede de la comunidad de desarrolladores que apoya el proyecto OpenOffice.org. El primer estándar está controlado por una empresa cuyos procesos están cerrados a terceros, mientras que el segundo promueve la participación del público en voz y voto.
En la industria de localización, los estándares se han vuelto algo muy común en años recientes. El almacenamiento de pares de unidades de traducción (origen > destino) para el intercambio de datos de traducciones pasadas está especificado en el estándar LISA TMX 1.4. El estándar OASIS XLIFF 1.2 establece una lingua franca en formato de archivo para traducción, con el cual se pueden intercambiar datos de traducciones actuales, además de dar soporte a flujos de trabajo, segmentación de texto y terminología. Aunque existen muchos otros estándares en localización, estos dos son los más comunes, quizá porque proporcionen los usos más básicos y necesarios.
El uso de un estándar único como XLIFF evita la complejidad inherente de tratar con múltiples formatos de archivo. Mientras el convertidor XLIFF se actualice para tratar con las últimas revisiones de estos formatos de archivo, no es necesario preocuparse de otros estándares.
El estándar XLIFF permite un fácil intercambio de información entre herramientas y procesos de traducción, aunque tiene como requisito previo un filtro de archivos que convierta entre el formato original y el formato XLIFF. Es decir, debe desarrollarse un filtro que separe los datos localizables (por ejemplo, texto y etiquetas de marcado relevante) de los no localizables (por ejemplo, etiquetas de marcado irrelevante y ciertos elementos multimedia) de forma estructurada. Por ejemplo, la solución libre Okapi Framework puede convertir entre muchos formatos de archivo y XLIFF, además de completar funciones de validación, entre otras.

(Ésta es la primera de mis entradas relacionadas con mi tesina del máster. Quedan dos más sobre estándares y ya cambio de tercio. Como veis, no valgo para investigador. Y no es falsa modestia.)

jueves, 23 de septiembre de 2010

Mención Ibidem y tesina

La semana pasada en Ibidem mencionaron esta santa casa como uno de los 20 blogs más prometedores sobre traducción de la blogosfera española. Su valoración y confianza es una ayuda para seguir adelante.

Cuando empecé este blog a finales de 2007, fue principalmente como un diario para mí mismo, para obligarme a investigar de forma más pública y compartir mis resultados. A veces se dice que un blog se abre para... digamos "socializar". El elemento social no me importaba en absoluto por aquel entonces, de hecho ni siquiera le dije a nadie que tenía un blog, ni puse enlaces a otros blogs, ni pedí enlaces, ni nada. Ahora no es que tenga muchos lectores, pero al menos sí tengo conexiones sociales pequeñitas, por aquí y por allá. Es un gran avance para un antisocial como yo.

Tira de Linuxhispano© Copyright 2009, Daniel Garcia Moreno (danigm)

Ahora llevo unos meses ocupado con la tesina para completar el máster de localización. En los últimos tiempos no conseguía avanzar nada, no estaba inspirado, no tenía motivación. De normal, escribir rollos científicos no es que me dé gustirrinín precisamente, pero en este caso además estaba en un atasco monumental del que no podía escapar: más de una vez pensé en dejarlo a medias y ponerme con otra cosa. La semana pasada se me ocurrió ir a trabajar a la biblioteca, donde no tendría ni WiFi (no he pedido el código) ni distracciones. Cuando tienes gente trabajando a tu alrededor, te inspira una especie de nube de motivación que te hace salir de tu letargo y trabajar aunque no quieras. Muy efectivo, se lo recomiendo a todos los que se distraen con el vuelo de una mosca.

Además, he pensado que todas las semanas publicaré aquí entre uno y dos artículos basados en los temas que estoy tratando en la tesina. Serán más reducidos que el original, menos soporíferos y científicos, y traducidos / adaptados al español, para no perder la práctica. Así me motivo un poco más: lo que hago no tiene sólo una utilidad académica sino una utilidad pública. Al fin y al cabo, la tesina sólo iba a quedarse cogiendo polvo sin que nadie la lea, pobrecita, con lo que cuesta de parir.

Por cierto, la tesina trata de herramientas y tecnologías de traducción libre. Tanto las herramientas como la actividad de la traducción son libres, ojo. A ver si se me ocurre algún título simpático para hacer la gracia ;)

jueves, 29 de julio de 2010

¿Se puede cobrar por algo que es gratis?

El otro día comentaba que si muchas webs se financian por publicidad, pero nadie quiere ver esa publicidad y la bloquea cuanto puede, tales webs acabarán sin ingresos y tendrán que cerrar. De esta reflexión salió desinstalar la extensión AdBlock de mi navegador, para al menos darles la oportunidad a los señores anunciantes de hacerme llegar su publicidad.

Desde que los periódicos empezaron a publicar versión digital se habla de cobrar subscripciones por acceder a contenidos. Muchos diarios, como El País y The Times pasaron un tiempo cobrando por acceso pero luego hicieron marcha atrás y volvieron a abrir sus contenidos. El amigo Rupert Murdoch denunció que Internet le está quitando el pan de la boca a sus churumbeles (y nietos). Ahí están The Times y The New York Times, que vuelven a la carga con la subscripción.

¿A qué viene todo esto? Hace unos meses hablé del Kindle de Amazon. Ahora han anunciado los Kindle de nueva generación, con WiFi y, lo que es más importante, un flamante navegador basado en WebKit (el esqueleto de Safari y Chrome). En el manual del nuevo cacharro he visto fotos del navegador en marcha y me ha sorprendido ver que está a la altura del navegador de un smartphone, pero con una pantalla el doble de grande.

Aparte del Kindle, Amazon vende libros, subscripción a blogs (sólo en EE.UU), a revistas y a periódicos. Por ejemplo, el acceso mensual a El País cuesta 20 USD. Es muy cómodo: al levantarte por la mañana, tienes el periódico descargado y listo para leer. Es una forma de contrarrestar el gratis total: facilitar el acceso al usuario / cliente, de forma que a éste le valga la pena pagar la subscripción.

Hay una alternativa a este modelo "de arriba a abajo", en el que el editor controla a través de un intermediario  la forma de distribución. Calibre es un programa que podría definirse como una biblioteca para catalogar / un conversor entre formatos / un recuperador de contenido. Es gratuito, abierto, multiplataforma, y se subvenciona con donaciones de usuarios y con acuerdos de integración con empresas. El caso es que Calibre accede a las webs de muchos periódicos y revistas, se baja los artículos diarios (o de los últimos días, según se quiera), los monta en formato ebook y los sincroniza con el dispositivo. Para entendernos, se seleccionan las publicaciones que queremos, programamos la hora de descarga, conectamos el ebook al PC y por la mañana tenemos el diario listo para leer. No tan cómodo como el Kindle, porque requiere Internet, un PC y bastante paciencia, ya que se tarda entre veinte minutos y una hora en preparar un diario (al menos en mi caso).

La gracia del método anterior está en que la publicación no la controla el editor, sino el usuario. ¿Tu diario favorito no está disponible en el Kindle? Quizá sí esté en Calibre. O quizá no está, pero puedes pedir a los simpáticos desarrolladores que lo incluyan. Si el diario específico es demasiado difícil de incluir y los desarrolladores están muy ocupados, puedes sobornarlos donar al proyecto para que se lo curren. O puedes cocinar tú mismo, hay manuales que explican como crear una "receta" para descargar una web. Yo lo intenté con un periódico portugués que me gusta mucho, Público, y me pasé muchos días trasteando hasta que funcionó. Subí la receta al desarrollador y éste la incluyó en la siguiente versión del programa. Luego me di cuenta de que mi receta fallaba más que una escopeta de feria, porque la web de Público es un desastre de diseño y el servidor es lento de narices. Pero bueno, lo intenté. Ahí está la receta para quien sepa más que yo del tema y quiera echar una mano.

Luego llegó el iPad y muchos periódicos y webs de televisión perdieron el culo se apresuraron para sacar una versión optimizada para la tableta de Apple. A pocos se les ocurrió pensar en el modelo de subscripción. Total, si el iPad tiene un navegador, los usuarios no van a pagar por una subscripción cuando tienen acceso a la versión pública y gratuita.

Y, como decía antes, ahora llega un nuevo Kindle con WiFi y un navegador muy chulo. ¿Vale la pena pagar por subscribirse a una publicación cuando se puede acceder gratis con una calidad y facilidad muy respetables? Con el Kindle antiguo, sin duda valía la pena. Ahora falta verlo, pero yo diría que depende del uso que le dé cada uno.

miércoles, 28 de julio de 2010

Optimización de la lectura web

Hoy he descubierto una extensión para Google Chrome muy útil llamada Readability Redux, basada en el servicio web de arc90, que Apple ha introducido en Safari 5. También hay una versión para Firefox.

Esta extensión, junto a otras como iReader o TidyRead, extraen el contenido útil de un artículo, ocultando toda la basura que facilita la navegación (artículos similares), la comunicación (comentarios, compartir) o que introduce publicidad, pero que dificulta la lectura, que es el al fin y al cabo para lo que se escriben los artículos. Obviamente, no funciona con todos los sitios web, porque cada sitio tiene un diseño más o menos diferente, pero sí con unos cuantos que he probado, como se puede ver más adelante.

Con la llegada de la nueva máquina de imprimir dinero de Apple del iPad, parece que la gran masa se ha dado cuenta de que las webs están sobrecargadas con diseño. Al trabajar con un dispositivo con pantalla reducida, navegación incómoda sin ratón ni teclado y sin Flash, a muchos se les ha encendido la lucecita de la innovación. "Si los diseñadores no nos ofrecen las webs como las queremos ver, ya nos encargamos nosotros de cambiarlas". Personalmente, para mí esto no es nada nuevo. Tengo una tableta de 12" (HP tx2000) desde hace más de dos años, y hace unos meses que utilizo un netbook de 10" (Asus 1005pe) como primer ordenador. Por no hablar del ebook que utilizo desde hace casi cuatro años. Sé lo que es no poder leer un artículo a gusto.

Gracias a esta extensión, puedo alternar entre el modo navegación y el modo lectura. Lo que me lleva a hacer un experimento: voy a prescindir de la extensión AdBlock (bloquea publicidad), a ver qué pasa. Los sitios gratuitos suelen estar financiados (siguen vivos) por publicidad, y si todo el mundo la bloqueara, no podrían seguir vivos. Imaginemos qué pasaría si a Microsoft le diera por bloquear por defecto los anuncios en su Internet Explorer 9. A todos nos gusta el contenido gratis, pero gratis no equivale a que no tenga valor. Si alguien me quiere acompañar en esta aventura, pero sólo quiere meter la puntita (del pie), puede añadir a la lista de excepciones de AdBlock sus sitios más visitados, o los que le caigan bien por lo que sea. Eso sí, no pienso desactivar FlashBlock, que los anuncios Flash son muy molestos y pesados.

Artículo de Wired (antes)
Artículo de Wired (después)
Artículo de Público (antes)
Artículo de Público (después)
Relato en shareable (antes)
Relato en shareable (después)

sábado, 24 de julio de 2010

Cambio de diseño

Tenía unos minutos aburridos y me ha dado por cambiar el diseño del blog.

Cuestiones estéticas aparte, he ampliado el ancho de la página para aprovechar mejor el área útil de las pantallas panorámicas, que son las más comunes hoy en día. Me he basado en mi netbook de 10" con una resolución de 1024x600 para comprobar que todo cabe bien, y entiendo que cualquier dispositivo con una resolución menor es un dispositivo móvil, del que no me tengo que preocupar porque directamente verá una versión optimizada para móviles. Espero que (casi) nadie vea una barra de desplazamiento horizontal.

Hace años tenía un blog en el que tenía que currarme yo mismo el diseño trasteando con HTML, CSS y demás. Me tiraba días hasta que lo dejaba todo funcionando, así que no me quedaban ganas de cambiarlo muy a menudo. Ahora, con el Template Designer de Blogger, es fácil y rápido darle un buen lavado de cara a tu casa. De todas formas, demasiados cambios marean al personal, y como todo informático sabe "if it ain't broken, don't fix it", por lo que será mejor que tampoco cambie el diseño muy a menudo.

domingo, 18 de julio de 2010

Privacidad en servicios gratuitos y miedo a la traducción automática

SDL Trados 2007 SP2 incluyó en su día un enlace a su propio servicio de traducción automática (MT). Si el usuario lo activaba, los segmentos (=frases) nuevos que no encontraban coincidencias en la memoria de traducción (TM) pasaban por este servicio de MT en línea y se devolvía la traducción debidamente marcada como "peligrosa". Esto marcaba el principio de un cambio de modelo de traductor a posteditor en sistemas de producción de escritorio.

Con SDL Trados 2009 SP2 se introducen proveedores de MT alternativos, como Google Translate o Language Weaver. Incluso SDL anunció a principios de mes la conexión a Microsoft Translator en su SDL TMS, su software de servidor corporativo para grandes volúmenes de traducción.

En la industria de la traducción se armó un gran revuelo al poner la MT al alcance del traductor común. Por una parte, porque ciertos clientes no querían que se utilizara MT bajo ningún concepto, aunque luego el traductor cambiara el texto de arriba abajo. Los clientes temían que el traductor se pegara demasiado al texto original o pasara por alto errores de la máquina, según el caso. Caen en el error de ver la MT como un sustituto de las habilidades del traductor en lugar de como una simple ayuda que acepta o rechaza el traductor en su calidad de experto posteditor.

En segundo término se dieron cuenta de otro problema: se estaban enviando fragmentos de texto potencialmente confidenciales a "terceras partes". Imaginemos el caso de una nota de prensa sobre una fusión de empresas que, filtrada antes de tiempo, puede provocar movimientos interesados de acciones en la bolsa, lo que se llama "abuso de información privilegiada" (insider trading). Las autoridades reguladoras podrían imponer multas multimillonarias a las empresas implicadas si sospechan de estas prácticas.

Personalmente, todo esto me parece una tontería. En los acuerdos de confidencialidad que suelen gobernar las relaciones entre los proveedores de traducción y sus clientes, se suelen utilizar términos vacíos para generalizar, como "terceras partes" o "terceros". Cosas de abogados, que son algo paranoicos. Estos "terceros" pueden ser un corredor de bolsa, la vecina del 4º, el loro del zoo o una máquina (no necesariamente consciente de sí misma, como Skynet). El caso es que se olvidan de la diferencia entre una máquina y un humano. Un ordenador no tiene mayor interés en comprar acciones, y al fin y al cabo la información que se envía a un proveedor de MT es sesgada, ya que son fragmentos sueltos que, de todas formas, no lee ningún humano. Estos fragmentos de texto son para consumo de la máquina, que puede almacenar información anónima para analizar en qué tipo de textos están interesados sus usuarios. En cualquier caso, todo esto está regido por los términos y condiciones del servicio.

Es como cuando Google integró AdWords en Gmail y se supo que una máquina leía los correos de los usuarios para ofrecer anuncios personalizados. Medio mundo puso el grito en el cielo y se desaconsejó el uso de Google Apps para empresas. No sé qué problema de privacidad veían, sinceramente. Cualquier correo es "leído" por varios servidores, conforme rebota por Internet hasta llegar a su destino. Si al tener correo gratis, me tengo que comer anuncios, lo acepto. Y mejor si son anuncios que me interesan, ¿no?

En resumen, las dos preocupaciones de los compradores de traducción, la reducción de calidad y la confidencialidad, no tienen mucho sentido.

En SDL Trados 2009 SP2, después de mucha insistencia y mucho rasgarse las vestiduras la comunidad, SDL añadió un cuadro de diálogo de confirmación advirtiendo del envío de información potencialmente confidencial a un servidor externo. Obviamente, si quieres que Google Translate te pretraduzca texto, habrá que enviarle el texto antes. Pues parece que algunos no lo entendían, de ahí que SDL tuviera que añadir el cuadro de diálogo de marras. En el blog de Pangeanic se habla del tema, indicando que también se envían los cambios del traductor al texto que ha pretraducido Google:
"There is a huge difference between providing an online post-editing environment with plain text as i/o and picking up human-approved segments from desktop applications."
Sólo se alimenta el motor de Google si utilizas a) la interfaz web de Google Translate o b) Google Translator Toolkit. En el primer caso, tienes que subir tu propuesta expresamente. En el segundo caso, puedes configurarlo para que tus documentos sean privados y no se alimente el motor con tus traducciones. SDL afirma en los foros de Proz que no devuelve los cambios introducidos en la postedición a Google. En cualquier caso, según lo entiendo, el API de Google Translate no permite que terceros envíen sugerencias.

Esta semana SDL ha anunciado la compra de Language Weaver, uno de los proveedores de MT más avanzados. SDL ya compró Trados en 2005, Passolo en 2007 e Idiom en 2008, entre otros. La compra de Language Weaver por parte de SDL integra otra sección del mercado en las ofertas de la compañía. Ya no hace falta que los señores clientes se salgan de SDL para comprar soluciones de MT. La mayor ventaja de Language Weaver, al tratarse de MT estadística, consiste en ofrecer motores personalizados a las necesidades de los clientes, por lo que SDL apunta a consolidar el mercado corporativo en este aspecto, ya que esta personalización no sale barata. Para el mercado, no creo que sean buenas noticias que una empresa vaya quedándose con cada vez más trozos del pastel. Esto sólo lleva al monopolio, donde los usuarios siempre pierden.

En 2005 SDL era mayoritariamente una empresa de traducción, más que una empresa tecnológica. Al comprar Trados, SDL pasó a ser una empresa de traducción que vendía software tecnológico a otras empresas de traducción. Esto no le hizo mucha gracia a otras empresas de traducción, que se vieron atrapadas. Volviendo a lo anterior, donde creo haber dejado más o menos claro que SDL no envía información de postedición a Google, muchos pueden dudar de las buenas intenciones de SDL en un futuro respecto a esta misma información cuando se utilice Language Weaver. El departamento de relaciones públicas de SDL va a estar entretenido las próximas semanas.

sábado, 12 de junio de 2010

Consumo responsable y boicots

Cada cierto tiempo aparecen noticias sobre los trabajadores de la fábrica donde se hacen los productos de consumo de Apple, seguro que habéis oído hablar de ello. Que si los trabajadores trabajan como mulas, que si cobran cuatro duros, que si no pueden hablar mientras trabajan, que si no pueden ir al aseo cuando quieren, etc. Que si un trabajador extravió un prototipo de iPhone, los de seguridad le metieron caña y se acabó suicidando por no poder soportar la presión. Últimamente ha salido la noticia de unos trabajadores que se han suicidado por no poder soportar la presión de las condiciones de esclavitud que sufren en la fábrica.
Cuando se habla de estas vergüenzas, invariablemente el dedo acusador apunta a Apple. Me duele defender a la demoniaca Apple, pero el caso es que estas fábricas son de una empresa taiwanesa llamada FoxConn, que, cosas de la vida, tienen otros clientes aparte de Apple. Entre otros, fabrican consolas para Nintendo y Sony, ordenadores HP... y el Amazon Kindle. Yo he tenido ordenadores HP, tengo la Wii y la NDS de Nintendo, pero esta vez he conseguido evitar el mal... ¿o no?
Sé que los ebooks de Sony se fabrican en China (a diferencia de mi antiguo ebook, que se fabricaba en Japón) y no me sorprendería que mi recién comprado PRS-300 se haya fabricado en FoxConn. El caso es que estuve investigando y no encontré referencia alguna a que así sea, por lo que puedo decir que he hecho lo posible para evitar financiar a esta panda de negreros.
Hace unos meses vi un documental austriaco llamado Nosotros Alimentamos el mundo (enlace a vídeo íntegro). La premisa fundamental es que un grupo cada vez menor de megaempresas controlan la cadena alimentaria de la mayoría de productos que encontramos en el súper. Desde las semillas, hasta la compra a agricultores, distribución, venta al por mayor, etc. Los monopolios (o holdings, o cualquier otra forma de control del mercado) son una forma muy útil de explotar a proveedores e imponerse ante clientes. En este caso, eso significa peores condiciones para agricultores y menor elección para el consumidor. Unos amigos míos han decidido boicotear a Nestlé, cuyo presi sale al final del documental de un maléfico subido diciendo cosas muy feas.
Recuerdo la última matanza en Gaza, de diciembre de 2008 a enero de 2009, cuando ONGs y activistas pidieron el boicot a productos israelíes. Vagamente, me suena que empresas israelíes tenían una presencia importante en cosméticos y en agua embotellada. En mi estancia en Irlanda sólo encontré albahaca fresca importada de Israel, y debo confesar que un par de veces compré.
Aunque no siempre cumplamos, creo que esta creciente consciencia del consumidor y preocupación por la procedencia de los productos es algo positivo. El cambio del consumidor de un ente pasivo que todo lo acepta a un cliente respondón y exigente es algo que alimenta la competencia y espabila a las empresas. ¿O estoy siendo un idealista y este tímido cambio de paradigma es sólo un espejismo y yo estoy hecho un radical y un abraza-árboles?
Si como consumidores, vamos siempre a lo más barato sin preocuparnos de dónde viene, luego, como traductores, no debería extrañarnos que los señores clientes nos hablen de comoditización, palabro abominable donde los haya.
Por comoditización, las cabezas pensantes de la industria entienden que la traducción, compuesta por las equivalencias que transfieren un significado de una lengua a otra, es una simple materia prima, como el carbón o el cobre. Y lo que tienen las materias primas es que son intercambiables, da igual de dónde vengan, que son fundamentalmente iguales. Siguiendo esta argumentación, afirman que el factor diferenciador es ser el más barato para llevarse el gato al agua. La calidad se sobreentiende. Obviamente, esto es una tontería como un piano, pero se convencen de que esto es así entre ellos y nos la clavan cuales trileros, dónde está la bolita, dónde está la bolita, zasca.
La próxima vez que vayáis a lo más barato, sin comparar, sin ver de dónde vienen los productos y servicios, ateneos a que vuestros clientes hagan lo mismo cuando escogen un traductor.

jueves, 10 de junio de 2010

Ebooks (capítulo 4): experiencia cerrada, pero perfecta vs. experiencia abierta pero limitada

Hace un par de meses extravié mi añejo ebook Sony PRS-500 en un avión y ya no volví a saber de él. Digo añejo porque tenía ya 3 años y medio, y eso en tecnología es el siglo pasado. A pesar de que los modelos actuales lo habían superado en ciertos aspectos, mi Sony Reader distaba mucho de estar obsoleto. Funcionaba perfectamente para mis necesidades, aunque la carga de la batería ya no era lo que antaño fue. Por muy tecnófilo que sea un servidor, no podía justificar pasarme a una chica más joven un modelo actual.
Al perder mi querido ebook conseguí leerme un par de novelas en el móvil, pero ya no soy un jovenzuelo y la pantalla retroiluminada del móvil no hace de la lectura una actividad demasiado agradable. No me malinterpretéis, soy todo un snob, pero cuando la necesidad apremia puedo leer un pbook (libro de papel, ¡toma contraneologismo innecesario!) como el que más. Pero no hay nada como un buen ebook de tinta electrónica.
El caso es que llevaba un mes consultando varias webs especializadas poniendo en la balanza los pros y los contras de varios modelos, e incluso preparé una comparativa según mis necesidades. Se podría decir que estos cacharros pueden dividirse entre gama baja (hasta 200 EUR), media (alrededor de 250 EUR), alta (hasta 300 EUR) y ridícula destinada a profesionales (de 300 EUR para arriba). Centrándome en la relación calidad precio (lo que estaba dispuesto a desembolsar para cubrir mis necesidades), la batalla quedaba limitada entre el Amazon Kindle y el Sony PRS-300.
Del Amazon Kindle ya he hablado en otra ocasión y sigo pensando lo mismo. Sin embargo, la tentación del lado oscuro es grande y la carne es débil. El Kindle tiene a su favor el diccionario inglés de serie (e intercambiable), el subrayado y la toma de notas (no válidos en PDFs), la librería integrada y, lo más importante, rumores insistentes de conexión a Internet sin límites (hasta ahora sólo se puede visitar la Wikipedia inglesa). En su contra tiene la librería integrada, la actitud chulesca y prepotente de Amazon (sólo superada por Apple) y la incompatibilidad con el estándar del mercado, el ePUB.



Kindle 2

Cuando digo que la librería integrada es un punto a favor y en contra a la vez, me refiero a que comprar un ebook es muy fácil. Demasiado fácil. Enciendes el ebook, escoges un título, haces click en el botón de compra y, zas, te desaparecen 9 EUR de la cuenta. Han conseguido que comprar un ebook sea más fácil que piratearlo. Pero, para mí, sigue sin valer la pena. Otro día cuento por qué.
Por otra parte, el PRS-300 o Sony Reader Pocket tiene como punto a favor el precio: entre 80 y 90 EUR menos, según la fluctuación del cambio dólar - euro. No tiene diccionario, ni notas, ni librería, ni Internet, incluso tiene una pulgada menos de pantalla. Por otra parte, tener 5" en lugar de 6" y faltarle un teclado físico lo hace más portátil: me cabe en el bolsillo de cualquier pantalón. Para leer novelas voy que me mato: utilizo el móvil como diccionario y unas hojas más boli que he colocado de forma estratégica en la funda del cacharro. Estoy muy satisfecho con mi compra.

Sony Reader Pocket


Los ebooks vendidos por Amazon son una variación del formato MOBI. Sólo Amazon vende ebooks en este formato. No se puede leer ebooks protegidos por cualquier otro sistema DRM en el Kindle. Por otra parte, los ebooks de Sony sólo pueden leer ebooks protegidos por el DRM de Adobe, implementado sobre PDF y sobre ePUB, el estándar del mercado. La diferencia reside en que prácticamente todas las e-librerías venden ebooks con el DRM de Adobe, por lo que la competencia es mucho mayor con este formato. Por ejemplo, el almacén digital español Libranda de venta al por mayor funciona(rá) con el DRM de Adobe, al igual que lo hará Google Books y muchos otros vendedores menores ya lo hacen. En cambio, si tienes un Kindle le tienes que comprar los ebooks a Amazon.
(Obviamente, esta explicación es una simplificación. Puedes cargar ebooks del dominio público, o con licencias abiertas, o comprarlos sin protección DRM, o incluso reventar la protección anticopia para leer tus ebooks donde te dé la real gana, aunque según el país donde residas esto último podría ser ilegal. El caso es que si quieres comprar ebooks con DRM sin calentarle la cabeza, la oferta de Amazon no es una buena opción.)
El Kindle per se es muy bueno, pero hay que leer la letra pequeña. A la larga, una opción no ligada a una e-librería particular sale más a cuenta. Dejo para otro día ver si vale la pena comprar ebooks con DRM.