viernes, 25 de noviembre de 2011

La confidencialidad en la era de la nube

Mi bro Miguel Llorens ha publicado una entrada sobre la traducción automática y la calidad y los encarnizados debates de la última semana en este nuestro blog. Como sucede en los mejores blogs, los comentarios han complementado la entrada y en este caso ha participado un traductor abogado para dar su perspectiva jurídica sobre el delicado asunto de dar chivatazos a la máquina. Su tesis, además de la confianza y profesionalidad entre traductor y cliente, es que pedirle a una máquina controlada por terceros que te dé información en tal idioma sobre X puede considerarse, potencialmente, un chivatazo sobre que alguien está interesado en ese X en tal idioma, lo que en ciertos casos puede relacionarse con un país. No había considerado este punto y tiene cierta razón desde un punto de vista jurídico, aunque no probabilístico.


Hace unos días me pregunté si es grave que una máquina acceda a cierta información. Que yo sepa, los datos volcados en GTranslate se utilizan solo para mejorar su modelo lingüístico y, supongo, para analizar qué tipo de documentos (y combinaciones) quieren comprender los usuarios. Que yo sepa, esos datos no se reutilizan para extraer, digamos, información bursátil privilegiada y aprovecharla para jugar con ventaja en la bolsa. No digo que no pueda pasar, ya sea por minería de datos oculta o porque un humano acceda a la información (sería más difícil que encontrar una aguja en un pajar compuesto por toda la paja del mundo). Solo digo que es improbable que pase y hay otras desgracias más cercanas y probables, que ejemplifico más abajo.

Supongo que un jurista no estaría de acuerdo, pero creo que el sentido común y la paranoia pueden tener tanta importancia como un contrato firmado. No para dirimir responsabilidades, que para eso está la ley, sino para evitar un desastre.

  • Ejemplo 1: un traductor trabaja en su portátil. Portátil que le roban cuando lo deja un momento en el suelo para, yo que sé, llamar un taxi. El traductor maldice y maldice, pero no se preocupa de sus datos porque su Windows lleva contraseña (¡y complicada!). El ladrón accede a sus datos con un simple live CD Linux y ve el documento confidencial, que resulta ser una nota de prensa que puede tener graves implicaciones en bolsa si se actúa con rapidez.
  • Ejemplo 2: un traductor hace copias de seguridad de los encargos en curso en un lápiz USB. Se queda sin luz y decide llevarse el lápiz a casa de un amigo para acabar allí los encargos. Por el camino, saca el móvil para avisar a su amigo de que está en marcha y, al sacar la mano del bolsillo, se le cae al suelo el lápiz y no se da cuenta. Aquí no hace falta ni acceder a los datos con un live CD Linux, no es necesario imaginarse qué pasa después.
  • Ejemplo 3: un traductor trabaja directamente en su tableta (conozco casos) cuando está conmutando al trabajo / la universidad y guarda sus datos allí. Una app de esa tableta requiere permisos especiales de acceso a los datos del usuario y conexión a internet (no es tan raro, créeme) y resulta ser malware que roba datos. No es necesario imaginarse qué pasa después.
  • Ejemplo 4: un traductor decide estirar las piernas y se acerca a una cafetería a seguir trabajando con el WiFi gratuito. Total, si lo hacía J.K. Rowling (offline), ¿por qué no va a poder hacerlo él? Va a pedir la contraseña, pero resulta que la conexión está abierta, sin encriptar. Pide un café y se pone a trabajar. Toda conexión y transferencia a un servidor no seguro (http, por ejemplo) la puede ver cualquiera (¡gran vídeo!) conectado a la misma red. No es necesario imaginarse qué pasa después.

¿Cómo evitar las dos desgracias anteriores? Encriptando una partición o una carpeta del disco/memoria, sea interno o externo. ¿Hacemos una encuesta en Proz para ver cuántos profesionales tienen sus documentos de trabajo encriptados? ¿Alcanzaría el 1 %? Cada vez en menos sitios hay wifis abiertas, pero ahí están y pocos tienen suficiente autocontrol para evitarlas.

Muchas empresas de traducción saben que la única forma mínimamente segura de garantizar la confidencialidad de la información y controlar el flujo de datos es utilizar una plataforma online propia y segura. No se reciben ni envían documentos por correo ni por servidores de FTP. Te llega un aviso, te conectas a su servicio y trabajas ahí. Cuando acabas, le das a finalizar y te pones a otra cosa. De ahí no sale información (texto, TM, glosarios), solo entra. Si se quieren poner bordes, te pueden prohibir hasta copiar texto para buscar términos dudosos en ese demonio del nuevo siglo, Google.

Dicho todo lo cual, siempre hay que cumplir acuerdos de confidencialidad y, en ausencia de estos, proteger la información que nos confían como mejor sepamos. Tan fácil es que te roben (=copien) datos en una cafetería como que te los robe (=copie) un servicio web. Antes que la nube y la tecnología está el sentido común.

lunes, 21 de noviembre de 2011

Traducción automática: mitos y leyendas, luces y sombras


Parece que mi anterior entrada ha gustado y ha levantado polvareda. Eso es bueno, hay muchas cosas que aclarar y principios que debatir. El caso es que me he puesto a contestar el comentario de Aurora y al final me he dado cuenta de que daba para una entrada nueva, casualmente con temas que andaba desde hace tiempo con ganas de desarrollar. Agarraos, que vienen curvas.

Confidencialidad del profesional, inteligencia artificial y propiedad intelectual
Asumir que todo el material que se nos entrega para traducir es confidencial no es algo válido. El ejemplo que he dado en la entrada anterior es el de GlobalVoicesOnline, trabajo que hago pro bono publico o, como se dice hoy día, por crowdsourcing. Son artículos ya publicados en inglés en su web para cuando empiezo a leerlos. Claramente, si está publicado en su web y accesible vía buscadores, Google ya lo ha visto. ¿Qué importa que yo lo pase por Google Translate o por cualquier otro motor público de terceros?
Ahora supongamos que se trata de una patente y de un encargo remunerado. Si esta patente tiene, digamos, diez años (caso muy posible) y lleva tiempo publicada en internet, accesible tanto por humanos como por máquinas, ¿qué más dará que yo pase el texto por Google Translate o por cualquier otro motor de terceros?
Tercer y último ejemplo. No sé si recordáis el follón que se armó al lanzarse Gmail. Asociaciones de derechos civiles y de usuarios de internet pusieron el grito en el cielo porque Google "leía tu correspondencia". Primero, Google no es una persona y, por lo tanto, no puede leer nada. Los servidores de Google leen (=extraen los datos relevantes de) tus correos sin intervención humana. No leen los adjuntos (que se sepa), pero sí el correo per se. Y aun así, se sigue utilizando el servicio alegremente. ¿A qué viene este rollo del correo?
AsiaOnline se dedicó a comprar libros de segunda mano a montañas para alimentar sus motores de TA. Esto no es ningún secreto, lo han dicho públicamente. Obviamente, al igual que Google y Microsoft, además de los datos de modelos lingüísticos, se dedican a rastrear la web buscando documentos multilingües de "alta" calidad para alimentar sus motores. La legalidad de este proceso es muy, pero que muy discutible. ¿Se aplican las leyes de propiedad intelectual a las máquinas si ningún humano tiene acceso a su contenido? El lío de Google Books no vino tanto por la digitalización de libros sin más, sino por indexar su contenido y poner a disposición del público fragmentos o páginas sueltas. Eso es algo que legiones de abogados siguen y seguirán discutiendo unos años más. Personalmente, lo veo moralmente válido, pero eso no viene al caso.
Para resumir: si es información pública y accesible por máquinas en internet de forma legal (sin claroscuros, LEGAL en mayúsculas), no puede ser confidencial.

¿Lo que es bueno para nosotros, los traductores, es bueno para el público en general?
AsiaOnline proporciona tecnología gratuita para crowdsourcing de la Wikipedia a lenguas minorizadas del sudeste asiático y del subcontinente índico. Puede haber detrás una simple campaña de imagen pública y publicidad, además de mantener opiniones discutibles y tener una agenda oculta de promoción de la posedición, ahí no entro. A veces nos olvidamos de que lo que es bueno para la humanidad no es necesariamente bueno para un colectivo, como el nuestro, por ejemplo.

¿Cuál es el objetivo de la TA y cómo será el traductor como profesional en el futuro?
El objetivo de la TA no es reemplazar al traductor (al menos no a medio plazo), es poder dar salida a volúmenes mucho mayores de información mediante la posedición y, en el caso de la TA sin poseditar, de facilitar el acceso a la información. Un servidor lee blogs de electrónica en ruso sin despeinarse (tampoco es que tenga pelo), por ejemplo. Que la profesión del traductor se trivialice en un simple técnico y sus condiciones laborales y de prestigio empeoren es otra cosa.

¿Estamos dando de comer a la bestia Google?
A Google Translate, cuando le pedimos que traduzca un texto, solo le damos datos para su modelo monolingüístico, no bitextual, lo que significa que no le damos datos de traducción, sino de cómo funciona una lengua por dentro. Para los datos de traducción ya está Google Translator Toolkit y, de todas formas, se puede desactivar el envío de bitexto una vez completada la traducción. Que Google cumpla su palabra ya es otro tema. Lo mismo va para las voces de alarma que afirmaban que, por traducir con Google Translate (u otros motores) dentro de Trados estabas enviando tus traducciones a Google (o LanguageWeaver o lo que sea). Paparruchas. Insidias, como diría aquel.

¿Cuándo damos de comer a la máquina?
Una vez más, no estamos alimentando el motor de TA de Google por pedirle que nos traduzca texto. Si, en cambio, aceptamos un encargo de posedición de un cliente que cuenta con un motor propio, entonces sí lo alimentamos. Cada cierto tiempo, volcará memorias de traducción en su motor y este se hará algo más listo cada vez. Y nosotros cada vez menos necesarios. Con el tiempo, es posible que nos convirtamos en poseditores o en consultores.
(Actualización 25/11/2011 12.55: hay un pequeño error en el párrafo anterior. Lo aclaro en este comentario.)

¿Aceptar encargos de posedición es pan para hoy y hambre de mañana?
Solo tengo una cosa que decir: el mercado es libre, para bien y (sobre todo, para los que estamos abajo) para mal. Y que lo que es bueno para la sociedad en general no tiene por qué ser bueno para un colectivo específico. Dos cosas: el mercado, el bien común y cada uno verá lo que hace. ¡Tres cosas, no dos! Mejor vuelvo a entrar.


viernes, 18 de noviembre de 2011

La posedición: ¿zombificación del traductor?

Los signos de interrogación son esos grandes amigos del periodista que necesita un titular impactante sin tener que mojarse demasiado. Son primos de los verbos en condicional o del "supuesto"; se sueltan bombas y luego se dice "yo no he sido, señoría".

Ríos de tinta electrónica han corrido, corren y correrán sobre la traducción automática y lo nociva que es para la percepción del trabajo del traductor. A nadie le sorprende que un cliente utilice Google Translate (antes usaban Babelfish) para traducir su web, un cartel de un negocio, una señal de tráfico (12 y 3, en Gales son unos cachondos) o un menú de restaurante. Y ahora voy a soltar la primera bomba sensacionalista: no hay nada malo en utilizar Google Translate o similar de forma profesional. Lo que es una irresponsabilidad (tanto del traductor como del empresario) es confiar en las máquinas. Y si no, que se lo digan a John Connor.

¡Muere, Google Translate, muere!

La traducción automática (TA) puede ser un producto o un proceso. En el primer caso, sirve para entender por encima el sentido del texto (gisting), algo útil para usuarios particulares, pero no para difundir o publicar un texto. Este fin no nos interesa a los traductores profesionales, es algo más de webmasters, especialistas en SEO y demás gente de mal vivir.

Lo que nos interesa es la TA como proceso: una pretraducción para que luego el traductor (que en este caso actúa como poseditor) corrija todo lo necesario para que el texto alcance la calidad necesaria. ¿Qué función tiene en este caso la traducción automática? El ahorro de tiempo y dinero. ¿Cuándo es contraproducente emplear TA? Cuando se tarda más en poseditar (arreglar) que en traducir desde cero. ¿Es siempre útil la TA? Depende del texto y de lo personalizado (preparado) que esté el motor para ese tipo de textos. Se ha investigado incluso la TA de poesía (1, 2 y 3 —todos PDF), que es el ejemplo que se suele poner para decir "la máquina nunca podrá sustituir al hombre". Hoy día no hay límites claros sobre qué tipos de texto son viables para TA, pero sí hay factores que hacen del resultado algo más o menos válido.

Hípsters: "O sea, la TA nunca podrá con la poesía".

Hay muchos sentimientos encontrados sobre la TA y la posedición. Está la postura formal de los malos la industria, ejemplificada en los artículos de Jaap van der Meer, líder de TAUS y TDA, donde no hay riesgos, sino oportunidades. Y luego está la postura escéptica del líder rebelde, Miguel Llorens, del que soy fan confeso, tanto por lo que dice por cómo lo dice: es el azote de la industria junto a Kevin Lossner, otro superhéroe.

Supongamos que aceptamos los postulados de Jaap, al menos en que la posedición solo es un paso más allá de corregir las coincidencias parciales de las entradas de la memoria de traducción. No es lo mismo tu propia memoria de traducción que una en la que han metido mano ciento y la madre, que, al fin y al cabo es de lo que se trata la TA (estadística), pero bueno, va, aceptamos la posedición como oportunidad de negocio.

En mis colaboraciones con GlobalVoicesOnline (ver mi perfil a la derecha) no traduzco, suelo poseditar. Para ciertos clientes y ciertos textos, también posedito de forma profesional puntualmente. Soy maquiavélico: me importa el resultado final (la calidad), no cómo me lo monto para llegar ahí (ahorro de tiempo o esfuerzo). Para saber si vale la pena usar TA en el texto al que me enfrento, suelo probar a poseditar unas cuantas frases. Si ahorro tiempo, sigo. Si pierdo tiempo, desactivo la TA y traduzco a capella. Si la TA me viene impuesta vía tarifas más bajas, no vuelvo a aceptar encargos de ese cliente final.

Antes también traducían, ahora solo poseditan

Pero llevo más de quinientas palabras escritas y todavía no he llegado al quid de la cuestión, a la zombificación del traductor. Y aquí entra un artículo de Jost Zetzsche, otro grande de la traducción, aunque no le vaya tanto eso de fustigar. En ese artículo, habla del problema de volver a traducir a pelo después de completar un encargo de posedición. Cuesta cambiarle el chip al cerebro. A menudo, los encargos de posedición consisten en dejar el texto aceptable, no perfecto. También cuesta dejarlo perfecto porque te tienes que cuestionar toda elección que haya hecho la máquina. Te puede sonar bien, pero ¿está bien de verdad? ¿No será que la máquina quiere despistarte? Es como revisar un texto de alguien que clava una frase a la perfección y a la siguiente habla español de Shenzhén: desconfías hasta de tu sombra.

Una vez leí el testimonio de un excelente traductor que trabajaba a peso. Te hacía 6000 palabras al día sin pestañear, pero él mismo reconocía que no vendía calidad, sino eficiencia. ¿Recordáis la pirámide de los servicios? Rápido y barato = no puede ser bueno. Cuando un cliente se le quejaba con detalles sin importancia le dice: "si quieres virtuosismo, contrata a otro. No traduzco literatura". Con el tiempo, este traductor podría reconvertirse y traducir a Shakespeare, quién sabe. Pero tiene el chip programado para la cantidad, no para la calidad, con lo que no es fácil cambiar, ni le interesa. Lo mismo con la posedición. Hay formas de evitar este estancamiento: traducir mucho más que poseditar, dejar pasar un tiempo antes de pasar a la revisión, hacer una revisión final crítica, en voz alta, con una fuente rara (que te fuerza a leer cada letra) y solo del texto meta… La posedición es, a la vez, una oportunidad y un riesgo. Pero cuidado: una vez se te pudre el cerebro, es difícil recuperarlo.

Actualización 18/11/2011 a las 12.12: Se me olvidaba mencionar el excelente artículo de Eva Martínez sobre la posedición, que se centra en detallar cómo enfrentarse a una posedición y qué tener en cuenta.

Tú verás
Nota: el sábado 19 se celebra una mesa redonda en Barcelona con traductores blogueros. Sirva esta entrada como mi aporte remoto y humilde homenaje a esos cuatro grandes. Dicen que toda presentación zen debe tener al menos un gatito…

martes, 25 de octubre de 2011

Recuento ponderado WWC

El recuento ponderado, que en inglés se conoce como Weighted Word Count (WWC), sirve para tener una estimación de cuánto esfuerzo nos llevará un determinado encargo. Veamos la siguiente imagen:

Recuento de Trados 2009
Recibes de un cliente un archivo XML que, al abrirse, muestra unos datos similares a estos. Se trata de un análisis del recuento de repeticiones y coincidencias contra la(s) memoria(s) de traducción del cliente. El cliente te pregunta cuánto tardarás en entregarle el encargo. Suponemos que puedes completar 2500 palabras (revisión incluida) por día. 43 000 palabras entre 2500 = 17,2 días. El cliente ya ha puesto pies en polvorosa. 10 000 palabras nuevas entre 2500 = 4 días. El cliente acepta. Y tú te has metido en un lío porque no has tenido en cuenta la montaña de palabras que hay más arriba. Esto se resume así: no todas las palabras pesan igual. No todos los segmentos (≈frases) cuestan lo mismo de traducir. Están los segmentos sin coincidencia alguna, los que se aparecen varias veces, los que están tal cual en la memoria de traducción o los que se parecen en mayor o menor medida a segmentos de la memoria. Todo esto suponiendo que la memoria sea más o menos de fiar, lo cual no pasa siempre. Y preferiría no entrar en debates sobre la conveniencia de descuentos por coincidencias en la memoria, gracias, estamos en 2011 y hay otras batallas más urgentes que luchar.

Hay varios métodos para sacar el WWC. He visto casos de clientes que añaden esta media al análisis de forma semiautomatizada, pero no sé cómo lo hacen. Yo lo hago con el CATCount, que es un programa gratuito de los creadores de Translation Office 3000. El programa es muy sencillo y permite cierta automatización. Admite logs en CSV de Trados (hasta 2007 y creo que SDLx también) o TXT de LogoPort. Así se carga el recuento tradicional. Por otra parte, se le puede cargar un patrón de descuentos (o peso) como si fuera una plantilla. Y con esto nos calcula el WWC.


Media ponderada de CATCount

Pero veamos cómo funciona el sistema. La idea no es calcular cuánto vamos a cobrarle al cliente o cuánto nos va a pagar, si es que no tenemos posibilidad de negociación. La idea es calcular cuánto tiempo nos va a costar, el esfuerzo. Así, 9978 palabras nos cuentan un 100 % porque no tienen coincidencia. Pero los segmentos con una coincidencia del 85-94 % contra la memoria nos cuentan la mitad de las nuevas, un 50 %. En este caso, hay ciertos grupos de segmentos que no se pagan porque no se revisan. Los segmentos exactamente iguales a otros de la memoria, por ejemplo. Estos se confirman y punto. Además, como curiosidad, y esto no es tan habitual, los segmentos del 95-99 % no se pagan. ¿Y por qué? Están bloqueados por el cliente y nosotros hacemos como que no los vemos. Como son cambios mínimos y, de todas formas, el cliente deberá revisarlos, ya se encarga él directamente.

Obviamente, la idea es utilizar los porcentajes de coste económico para evaluar cuánto tiempo emplearemos en cada segmento. Este coste económico puede venir impuesto por el cliente en forma de descuentos o porcentajes distintos a los habituales, o podemos derivarlo nosotros mismos con los porcentajes predeterminados de un programa tipo Trados. Está claro que podemos hacer lo mismo con unas cuantas formulitas en una hoja de cálculo y una importación del CSV del análisis, si es que lo hay. Eso ya depende de la habilidad de cada uno con las hojas de cálculos y si le aporta algo extra hacerlo directamente ahí en lugar de en CATCount.

Así, concluimos que este proyecto nos llevará un esfuerzo de 13 298,05 palabras ponderadas entre 2500 diarias = 5,32 días de trabajo, es decir, 6 días para curarnos en salud si nos encontramos con que la memoria no está en perfecto estado.

martes, 27 de septiembre de 2011

¿A quién le importa la calidad?

Después de confirmar una reserva de Ryanair, he imprimido el billete y me he dado cuenta de que aparecen un par de frases en catalán en medio del español. Luego me ha dado por leerlo todo y me he llevado las manos a la cabeza por el número de fallos que he encontrado.

Sí, debería haber usado colores distintos
Ryanair es una de las aerolíneas con más éxito de Europa. Mayor volumen de facturación, mayor número de pasajeros. Arrasa, sin más. ¿Porque es buena? No, porque es barata. Muchos viajeros no necesitamos lujos, simplemente ir del punto A al punto B sanos y salvos y sin demasiados retrasos.

¿A quién le importa que el español de su web lo traduzca un irlandés loco en sus ratos libres? ¿Que lo maquete un diseñador borracho? ¿Que el control de calidad de su web lo haga un mono tití con tutú? Eso es irrelevante. Lo importante es que son baratos.

Se suele decir que, cuando proporcionas un servicio, tienes tres factores relevantes: calidad, precio y velocidad. Cuando el servicio se proporciona en equilibrio, las cosas salen bien. Cuando recortas dos, el tercero queda para el arrastre. ¿Quieres una revisión rápida y buena? No será barata. ¿Quieres una maquetación buena y barata? No será rápida. ¿Quieres una traducción rápida y barata? No será buena.

Pirámide invertida de servicios
Ejercicio de agudeza visual: observe la imagen anterior y diga, en menos de un minuto, si esta pirámide es sostenible sin trucos.

La (buena) traducción es algo propio de un delicatessen. Intenta venderla a los que saben apreciarla y están dispuestos a pagar por ella. Los demás no te darán ni cacahuetes.

martes, 13 de septiembre de 2011

Diversión localizadora con delimitadores de millar

Wikilengua es una iniciativa de Fundéu BBVA, Red.es y la UAM que se surte de contribuciones de la comunidad para exponer las normas lingüsticas del español de forma clara y abierta. Cito de su página sobre los números.
Aunque todavía es práctica común en los números escritos con cifras separar los millares, millones, etc., mediante un punto (o una coma, en los países en que se emplea el punto para separar la parte entera de la decimal), la norma internacional establece que se prescinda de él. Para facilitar la lectura de estos números, cuando constan de más de cuatro cifras se recomienda separar estas mediante espacios por grupos de tres, contando de derecha a izquierda (12 000). Esta recomendación no debe aplicarse en documentos contables ni en ningún tipo de escrito en que la separación arriesgue la seguridad. No se utiliza nunca esta separación, ni tampoco el punto, en la expresión numérica de los años, en la numeración de páginas, portales de vías urbanas y códigos postales, ni en los números de artículos, decretos o leyes.
Los señores académicos de la RAE que se sacaron de la manga tales excepciones a la norma probablemente no toquen mucho un ordenador. Desde luego, no les veo en el Google Summer of Code. Porque si fueran, algún informático les metería una katana (con k) entre ceja y ceja, por listos.

Pregunté a Fundéu si todo este lío venía de la Ortografía o de dónde y resulta que sí, que no es el trabajo de un mono borracho algún vándalo que ha hecho un destrozo en la wiki. Podría haberlo consultado en la nueva Ortografía, pero no me apetece comprármela.

Configuración regional de Windows
En informática, "locale" es el conjunto de instrucciones lingüísticas y regionales que definen la estructura de números, medidas, monedas, fecha y hora, etc en un sistema (operativo). La fotico de arriba es la personalización del locale permitida en Windows 7. Mi Windows 7, concretamente, que totalmente actualizado cree que el separador de millares es un punto, algo que ya no es así oficialmente desde la publicación de la Ortografía de la Santa RAE el año pasado. Bueno, no pasa nada, se puede poner otro carácter en lugar del punto y yo he elegido un espacio fino (U+2009)* que he introducido vía Mapa de caracteres y luego he pegado en su casilla.

Pero ¿qué hago con eso de las recomendaciones? Que si números de cinco o más dígitos, que si números de menos, que si textos técnicos o generalistas, que si códigos postales… Pues no hago nada. No puedo hacer nada. Unos sistemas permiten más o menos personalización de los locales, pero difícilmente sabrá el sistema si el texto es científico, jurídico o literario.

Y ¿para qué sirve tener el locale configurado con el separador correcto de millares? Pues para dar formato a los números en Excel, por ejemplo. O, más útil en la traducción, para los placeables y el control de calidad.

Punto 1: los placeables o transferibles, según terminología Trados, son elementos reconocidos como invariables o que deben adaptarse a un locale. Por ejemplo, un número (200,000), una medida (200 km), un vínculo, o una etiqueta (<br />). Trados agrupa estos elementos como una unidad y permite situarla en su justo lugar en la traducción. Por defecto, Trados nos adaptará el placeable si puede, así 200,000 se convertirá en 200.000, cuando hoy día debería adaptarlo a 200 000.

Punto 2: control de calidad. Ya sea en APSic xBench, en Yamagata QA Distiller o en el controlador interno de Trados, el control de calidad se da cuenta de si hemos puesto un numerito distinto en la traducción del que venía en el original, teniendo en cuenta las diferencias de locale. Es decir, si en inglés pone "200,000.00", el programita buscará en el locale para saber cómo se debe adaptar este número al español y señalará como error lo que cree que no está correctamente localizado.

El problema es que, aunque cambiemos el símbolo de separación de miles de la Configuración regional de Windows de punto a algún tipo de espacio, Trados no se da por aludido. Sustituye los números bien, sí, pero detecta como error lo que está bien y deja pasar lo que está mal, con lo que el control de calidad automático… deja de ser automático. Para Trados, en español "200.000" y (por alguna razón) "200,000" están bien, pero 200 000 no. Lo mismo pasa con ApSIC XBench, pero en QA Yamagata Distiller se pueden definir locales a medida (aunque no es fácil), con lo cual es el único control de calidad que funciona correctamente en español, si exceptuamos la excepción de los números de menos de cinco dígitos.

Yo veo dos caminos para resolver este problema.
  1. Podemos localizar los números bien desde un principio aunque el control de calidad los detecte como error y tengamos que hacer una comprobación manual de que los números coinciden en los segmentos de origen y destino. Un control manual implica mucho más tiempo y esfuerzo y lleva al error humano.
  2. Podemos dejar que Trados localice los números como mejor le parezca de forma que el control de calidad detecte solo los números que no coinciden, es decir, los verdaderos errores. En este caso, tendremos que localizar los números a posteriori. ¿Cómo? Efectivamente, justo lo que te temías, con expresiones regulares. En Trados 2009, Control+H, activas "Expresiones regulares" y sigues estos pasos, cambiando los puntos de reemplazo por los espacios que necesites. Si es un archivo de Word, también puedes hacerlo al final siguiendo estos otros pasos (incluye truco para no arreglar lo que el cliente se niega a pagarte) o este maravilloso videotutorial de Xosé Castro. También es factible no usar delimitador para los millares de cinco dígitos o menos, como manda la RAE, haciendo modificaciones a los patrones, pero ahora no me apetece pensar cómo.
Por cierto, he creado una macro siguiendo los pasos de maese Castro, pero cambiando los puntos de millar por espacios finos (U+2009). Para importarla, en Word, dale a Alt+F11, File > Import File, selecciona .BAS, cierra Visual Basic. Para asignar un atajo de teclado (en Word 2007/2010), File > Options > Customize Ribbon > Choose commands from > Macros > escoje (Normal.NewMacros.)Localizarnúmeros > Keyboard shortcuts (Customize...) e introduce una combinación de teclado para ejecutar la macro. En Word 2003 o anteriores, tengo entendido que se accede a esta opción por Tools > Customize. Si sabes una forma menos farragosa de compartir una macro, avisa y actualizo la entrada.

¿Y tú? ¿Cómo te enfrentas a este problema? ¿Se te ha ocurrido otra solución? ¿Usas otro software distinto a Trados que sí está preparado para la norma actual en español? ¿Habrá llegado alguien a leer hasta aquí sin darle un telele?

Quiero agradecer a la ISO, por inventarse lo de los espacios en el Sistema Internacional, a la RAE, por añadir excepciones absurdas, a SDL, por no entender que los espacios también son delimitadores, y a Microsoft, por no dejar (ver nota al pie) usar el espacio adecuado como delimitador de millares y no aceptar un verdadero espacio duro como duro. A todos vosotros, gracias por hacerme la vida un poquito más difícil cada día.

* El espacio fino (U+2009) funciona como duro (200 y 000 no se separan a final de línea) en Word, mientras que en la mayoría de formatos no es duro. En WordPress, el gestor de webs más popular, por ejemplo, hay que usar el espacio duro angosto (U+202F), ya que U+2009 no sirve, como es lógico. Como curiosidad, la Configuración regional de Windows no acepta U+202F como delimitador válido y eso que es el espacio recomendado para los números. Microsoft, como siempre, se pasa los estándares por el forro.

miércoles, 31 de agosto de 2011

Subtitulación personal en cine para sordos

Leyendo el blog de iheartsubtitles, me he topado con un interesante artículo sobre la subtitulación en cines. Se puede decir que hay dos tipos de subtitulación: para quienes no entienden el idioma hablado y para quienes no pueden oírlo (y quizá tampoco entenderlo). Este mes Hoy toca hablar de la subtitulación para sordos y la piratería como un bien social.

Resulta que hay una app para iPhone llamada, en un ataque de originalidad, Subtitles. Esta aplicación se conecta con la base de datos de OpenSubtitles, se descarga el archivo de subtítulos que queramos para la peli que vamos a ver y reproduce los subtítulos mientras la estamos viendo. Así, tenemos la gran pantalla del cine donde vemos la imagen y la pantallita del móvil donde leemos los subtítulos. No es que sea muy cómodo tener que aguantar el móvil durante dos horas, pero es mejor que nada. Y, antes de que alguien se lleve las manos a la cabeza, sí, se reduce el brillo de la pantalla para no molestar a los demás, aunque supongo que si tienes a alguien justo al lado, será imposible que no le moleste la poca luz emitida.

Aparte de los problemas ergonómicos, la app tiene más inconvenientes. Por un lado, los subtítulos a menudo no son los oficiales, especialmente si se trata de una peli de estreno. Es decir, que puede haber problemas de calidad en la transcripción, en la traducción o en la sincronización con el vídeo. Además, quizá el subtítulo descargado no está preparado para sordos, con lo que no hay audiodescripción del sonido ambiente, no se indica la entonación de los personajes ni qué personaje está hablando cuando está fuera de cámara. Incluso es posible que no haya subtítulos para la peli que vamos a ver al cine o que no estén disponibles en el idioma que necesitamos. Es lo que tiene el crowdsourcing y el tsunami de contenido basura, que diría Miguel Llorens. Para todo ello, mejor asegurarnos antes de ir al cine descargando y comprobando los subtítulos para evitarnos una desagradable sorpresa.
Captura de Subtitles para iPhone
Finalmente, tiene un problemilla de funcionalidad. El subtítulo no empieza solo, hay que esperar a escuchar la primera línea de diálogo para pulsar Play y que comiencen los subtítulos. O sea, que los que tengan una sordera cercana al 100% deberán ir acompañados al cine o llevarse un cartelito para pedir al vecino de asiento que les dé un golpecito cuando comiencen a hablar. Algo ridículo, sinceramente.

Para más detalles, leed este análisis de la app. Faltaba más, los herejes de la manzanita androideros también tenemos nuestra app. SubtitlePlayer viene a hacer lo mismo solo que hay que descargar los subtítulos por separado (hay otras apps de Android para esto) y no es tan elegante como la de iPhone, ya que hay demasiada información en pantalla. A cambio, la reproducción del subtítulo empieza automáticamente (aunque es probable que necesitemos ajustar el inicio) y vibra cuando cambia el subtítulo, con lo que en películas de arte y ensayo con poco diálogo no es necesario estar pendiente de la pantallita.

Como ya digo, no es la solución idónea, ni mucho menos, pero abre las puertas del cine a los sordos, ya que son poquísimas salas las que emiten en VOSE y menos aun las que incluyen audiodescripción, si es que hay alguna en España. Probablemente sería una buena inversión para las salas instalar pantallitas en un porcentaje de butacas, como en los aviones, para quien quiera leer subtítulos sin que estos ocupen espacio en la gran pantalla. Y que las distribuidoras incluyan una pista de subtítulos con los estrenos, claro. Sin embargo, mucho me temo que esto será imposible sin decretazo gubernamental, al igual que en Cataluña hubo decretazo para que las salas primaran el doblaje en catalán.

Finalmente, una nota sobre la piratería. A la industria cinematográfica no le hace ninguna gracia que existan páginas donde cualquiera puede descargarse los subtítulos de una peli o de una serie de TV. Afirman que ello incita a la piratería, ya que, si no se pudiera acceder a los subtítulos, la gente se descargaría menos material pirata. Vamos, persiguen a sus clientes internacionales y/o sordos para proteger su mercado. Poco importa si los subtítulos son oficiales o si es fansubbing. Lo más curioso es que la industria fonográfica hace lo mismo con las páginas de letras de canciones, aunque desconozco su justificación. ¿Acaso todos los discos se venden con libreto con las letras?

Este rollo sobre piratería viene a cuento porque hay usos lícitos para algo considerado material copiado sin autorización, como son los subtítulos. Y estas apps para subtitulación personal en el cine son un buen ejemplo de este uso lícito. Ningún estudio estaría en contra de estas apps, que, al fin y al cabo, suman espectadores que no pisarían una sala en condiciones normales. ¿Verdad? ¿Verdad que no? Pues Apple lleva más de un año rechazando actualizaciones para Subtitles en iPhone por infracción de derechos de autor. El siguiente vídeo va dedicado a los manzaneros aficionados a soltar, a la mínima, el cansino adagio "¿pero Google no prometía no hacer el mal?".
¡Toma moreno!

lunes, 18 de julio de 2011

Despertares inteligentes, mañanas productivas

Hay muchas formas de despertarse. De pequeñitos, nos levantábamos solos e íbamos a molestar a los papis. Luego nos hicimos más remolones y eran los papis quienes tenían que despertarnos primero con buenas palabras y luego arrancándonos la manta. Más adelante vinieron los despertadores, y había de muchos tipos.

Estaban los de campana, también conocidos como "mi primer infarto".
Foto de cortesía para los más jóvenes: "así nos despertábamos en la guerra"
Los de pitido, que servían de bien poco. También estaban los que tenían grabaciones de sonido. Yo tenía un gallo que decía "kikiriki, buenos días" cada vez más alto hasta que le metías un puñetazo en la cresta. Como acabé odiando el gallo.
El gallo de marras
Los radiodespertadores, tan multifunción ellos. Según la emisora y el volumen, te podías levantar poco a poco con conversaciones que te recordaban a cuando tus papis venían a despertarte... o te podías levantar de un brinco si te habías olvidado de bajar el volumen.

Y luego está la ciencia, que avanza que es una barbaridad.

Hay despertadores lámpara con una luz que se va iluminando poco a poco, como si fuera entrando la luz del alba en tu habitación. Combínese esto con el gallo que te da los buenos días para un despertar de campo. Siguiendo con el tema bucólico, te puedes despertar con los sonidos de la naturaleza. Que si un manantial, que si unos pajaritos... Y luego está el todo en uno, te regalo aromaterapia y voy a la ruina, para que te despiertes con los chakras bien abiertos. O algo.
Despertador de última generación
Claro que hoy día mucha gente prefiere usar el móvil como despertador. Y aquí llegamos al meollo de la cuestión. Como dicen los yanquis, there's an app for that. Recuerdo a los presentes (hola, ¿hay alguien ahí?) que esto es un blog de tecnología además de traducción.

¿Sueñan los androides con ovejas eléctricas? Si tienes Sleep as an Droid (0,99 EUR), va a ser que sí. Durante la noche, pasamos por momentos en que estamos más dormidos y por otros en que estamos menos dormidos. Si el despertador suena en un momento de sueño profundo, nos levantamos de mal café y nos cuesta bastante despertarnos del todo. Si, por el contrario, suena el despertador en un momento en que estamos más cerca de la vigilia, nos despertamos mejor. En resumen: aprovechamos las horas de sueño y nos levantamos más fácilmente.

La teoría es que poniendo el móvil en la cama (yo lo pongo debajo de la almohada, para no tirarlo de la cama de una coz), este registrará nuestros movimientos nocturnos y decidirá, en una ventana de 30 minutos sobre la hora límite, en qué momento sonar. Una vez paramos la alarma, podemos calificar el sueño y se entiende que el programa va aprendiendo, pero yo paso de hacer esto y me va muy bien. Lo único malo del invento es que el teléfono no puede entrar en modo de suspensión, con lo que la pantalla se queda encendida (pero sin brillo) y podemos fundir media batería en una noche.
Nuestros meneíllos nocturnos
Además, el programa te avisa cuándo es hora de irte a dormir para que tengas un sueño de belleza reparador, te permite hacer una grabación de sonido durante la noche (la batería no aguanta) para demostrar de una vez por todas que no roncas, vibra si roncas demasiado y te obliga a resolver una operación matemática para que demuestres que no te vas a dar la vuelta en cuanto desactives la alarma.

Por supuesto, el programa no es remedio infalible para no apagar la alarma y darnos media vuelta, por muy despiertos que estemos. Solo Wallace tiene solución a ese problema. Para evitar esto, lo mejor es tener algo que hacer a primera hora e irse a dormir pensando en lo que hay que hacer al día siguiente.

También está la app de los campeones, Wakemate, que también está para iPhone y BlackBerry. Esta depende de una pulsera que se comunica con el móvil. Así tiene unos datos mucho más precisos sobre tus pulsaciones y tal. Me imagino que es la única solución para los que duermen en pareja, ya que dos cuerpos en una misma superficie seguro que lían a apps que captan el movimiento directamente desde el móvil. Eso sí, la pulsera son 59,99 USD más aduanas.

Obviamente, todos estos métodos, incluso los más modennos e inteligentes, palidecen comparados con que te saquen del reino de Morfeo las caricias y susurros de tu pareja. Para todo lo demás, ponga un androide en su vida. No se quejan y, a la larga, salen baratos, créame.

miércoles, 13 de julio de 2011

Espacios que nunca se secan y aventuras tipográficas

Siguiendo con la tradición de usar horripilantes juegos de palabras en este blog, hoy hablaré de los espacios insecables, un galicismo que hace referencia a los espacios duros del mundo de la tipografía. Un espacio duro es el que obliga a que un conjunto de caracteres A acompañe a un conjunto de caracteres B, evitando su separación en situaciones límite. Como me explico como un diccionario, veamos mejor un ejemplo gráfico.
Captura de Word 2007
En la primera línea hay un espacio normal de toda la vida (U+0020) entre el "0,7" y el símbolo de porcentaje. En la segunda línea hay un espacio duro "normal" (U+00A0) entre estos mismos grupos. En el caso del primero, cuando hay que cortar una línea (o una página), estos dos grupos quedan separados, algo que molesta en el mejor de los casos y que confunde en el peor. Nótense los simbolitos raros que separan grupos de caracteres y marcan los párrafos: se trata de la opción de mostrar los caracteres ocultos, algo vital en Word para vigilar la buena tipografía.

Otro inciso. En español, hoy en día es obligatorio un espacio entre un número y un porcentaje, entre un número y su medida (peso, capacidad...) y como separador de millares de más de cuatro cifras. Bueno, esto último forma parte de una recomendación ISO, pero el caso es que hace poco nuestra tan amada RAE tuvo a bien recordárnoslo en la Ortografía de 2010.

Pero volvamos a la captura anterior, que todavía tiene su miga:
Captura de Word 2007
Pero hay más de un tipo de espacio duro. Como tenemos marcada la visualización de caracteres ocultos, podemos apreciar (acércate a la pantalla, más, más, ahí) una diferencia entre el espacio duro del segundo párrafo y el del cuarto. En el segundo, hay un circulito alto, mientras que en el cuarto no, y sin embargo, este último sigue siendo duro porque el "100" está junto al "000". En el caso del cuarto, se trata de un espacio duro angosto (U+2009), el que se utiliza en francés (espace insécable) para separar el último carácter de una frase del símbolo de puntuación doble (exclamación, interrogación, punto y coma, dos puntos y comillas latinas o guillemetes). Es decir, "attention !" y no "attention!".

Por supuesto, hay más tipos de espacios duros, como el junta palabras (U+2060), que se utiliza en ciertas lenguas (¿árabe? ¿lenguas índicas? [pdf]) para marcar un espacio pequeñito, pequeñito y que no se corte la línea entre las dos partes de la palabra compuesta. El caso es que hay frikis expertos en tipografía que quieren una separación más fina entre palabras que la que proporciona el espacio duro normal, de ahí que insistan en un espacio duro angosto cuando este no es habitual del español. El problema es que no todas las fuentes, ni todos los lenguajes (formatos), ni todos los sistemas son compatibles con estas chuladas tipográficas y a menudo fallan con todo lo que no sea un espacio normal o un espacio duro normal.

Captura de Notepad++
Se me ha ocurrido guardar el documento de Word 2007 anterior a texto sencillo (TXT) con las opciones por defecto. Como se puede ver en la captura anterior si te acercas mucho a la pantalla, el espacio anterior al porcentaje es distinto entre la línea 1 y la línea 3, con lo que nuestro espacio duro normal ha sobrevivido la conversión. Por otra parte, se ha corrompido el carácter espacio duro angosto durante la conversión. No es un problema de fuente, ya que la Courier New puede mostrarlo sin problemas, es un problema de codificación. Cuando digo opciones de guardado por defecto, me refiero a que Word es incapaz de convertir a TXT un archivo con caracteres Unicode: no funciona ni la ANSI predeterminada, ni Unicode, UTF-8 ni ninguna otra variedad.

Si el mismo programa es incapaz de no hacer una conversión en condiciones, imagínate qué pasará cuando se hace un copia-pega entre formatos o cuando se utiliza un programa para convertir un archivo creado por otro. Una fiesta, vamos. Por ello, es preferible evitar siempre el espacio duro angosto en español y, en el caso del francés (y otros usos requeridos), asegurarse de que el sistema de presentación final es compatible con nuestras necesidades. De mi época de gestor de proyectos, recuerdo un cliente que exigía las traducciones al francés sin espacios insécables, porque su sistema de e-learning no los admitía. Como Word los añadía automáticamente, había que hacer un reemplazo masivo antes de la entrega final.

Además, recomiendo en ciertos casos avisar al cliente antes de utilizar un espacio duro normal. Por ejemplo, si estamos traduciendo el texto en pantalla (OSD) de un aire acondicionado, igual el sistema del cacharro no admite este carácter y aparecerá con un cuadradito en su lugar, algo que provocará la ira sin límites en nuestro cliente si se da cuenta antes de mandar a producir o una reclamación por daños y perjuicios si no se advierte el defecto antes de llegar a mercado. Cuidadín de pasarnos de listos.

Una nota final antes de cambiar de tercio. Entre paréntesis, después de introducir cada tipo de espacio, he añadido la representación en Unicode (un estándar para guardar texto digital) hexadecimal del carácter específico. En Word se introducen estos códigos hexadecimales con el mapa de caracteres.

Mapa de caracteres
Los caracteres hexadecimales no sé introducirlos a pelo, pero en Microsoft Word tenemos un par de atajos para los espacios duros: el espacio duro normal es Ctrl+Mayús+Espacio, mientras que el espacio duro angosto es Ctrl+Alt+Espacio.

Actualización 20/07/2011: Me he dado cuenta de que Word no viene de serie con el espacio duro angosto. Hay que abrir el mapa de caracteres (menú Insertar > Símbolo), introducir "2009" (Thin space, en terminología Unicode) en "Código de carácter", pinchar en "Teclas..." y asignarlo a una combinación que no esté en uso. Yo he escogido Ctrl+Alt+Espacio por similitud con el combo Ctrl+Mayús+Espacio que viene de serie con Word para el espacio duro normal. Si introduces "202F", que equivale a "Narrow No-Break Space", Word no te hace caso y pone la misma separación que con un espacio duro normal.

El primer ejemplo todavía tiene un detalle más, relacionado con la reciente modificación de la nueva Ortografía de nuestra querida RAE.
Captura de Word y la fuente Georgia
Si no recuerdo mal, ya hace tiempo que no es obligatorio acentuar la "o" entre números en medios digitales porque la tipografía permite distinguir perfectamente una "o" de un cero. Con la nueva Ortografía de 2010, se elimina la acentuación de la "o" y punto, sin hacer referencia a si se distingue o no, si se trata de un medio digital o analógico (escritura a mano). Esto es peligroso, como puede verse en la captura anterior. Cada fuente representa un carácter como le viene en gana, y resulta que la Georgia (una fuente nada exótica) no distingue demasiado entre la "o" y el cero. Si te fijas bien, la "o" es ligeramente menor que el cero, pero no queda nada claro con tamaños de letra menores o en una impresión específica. Si desactivamos la visualización de caracteres ocultos, en la mitad inferior de la imagen, no se distingue también la separación y tendríamos más problemas si disminuyéramos el kerning o interletraje, o si utilizarámos un espacios más angostos.

Estos dos temas salieron de una conversación tuitera con @escepticina@javmallo y @miguellorens, por lo que les dedico esta entrada.

martes, 28 de junio de 2011

Metataquillas digitales (OT)

Hablo raro, ¿verdad? "Metataquilla", ¿qué será eso? Pues una taquilla digital que se nutre de otras taquillas, digitales, claro. Servicios como Megaupload, Fileserve o 4shared son taquillas digitales (digital lockers), aplicaciones web con un espacio de almacenamiento donde guardar nuestros archivos. Luego que los compartas con terceros o desconocidos copiando el enlace de descarga en un foro es algo secundario y no obligatorio.

Para compartir archivos, la descarga directa es mejor que sistemas p2p como Bittorrent porque a menudo se descarga más rápido al conectarse a un servidor especializado y porque son servicios más fáciles de usar que los sistemas p2p. Pero tienen dos grandes desventajas: los archivos son más vulnerables y desaparecen fácilmente y a menudo tienes que esperar varios minutos (u horas) entre descarga y descarga a no ser que pagues una suscripción a la taquilla de turno. Y es un mercado tan fragmentado que sale muy caro estar suscrito a más de una taquilla. Aquí entran las metataquillas digitales.


Las metataquillas digitales tienen un funcionamiento muy simple: actúan como intermediarios entre las taquillas y el usuario que quiere descargar de ellas. Pegas una ristra de enlaces en la aplicación, esta empieza a descargarlos y te ofrece los enlaces para descargarlos a buena velocidad y casi sin esperas.

Personalmente, conozco tres: Downloadnow, MyDownloader y Leechpack. Estas aplicaciones suelen diferenciarse en tres niveles: precio mensual, número de taquillas compatibles y límites de descarga. Este mes he estado suscrito a Downloadnow (si te suscribes con este enlace, me llevo crédito para la descarga) y me parece que es un servicio algo limitado. No da problemas y va rápido, tiene bastantes taquillas, pero los límites son excesivos. Empiezas con 10 Gb de crédito, cada 24 horas te añaden 1 Gb y puedes tener hasta 15 Gb. Sale a 8 euros el mes, con pagos recurrentes a no ser que los canceles.

MyDownloader tiene una interfaz casi calcada, funciona incluso mejor (una vez tiene los enlaces, te los descarga a tu PC automáticamente) y tiene un número similar de taquillas compatibles. Sale a 6 euros al mes, con pagos recurrentes a no ser que los canceles. Estos te dan 3 Gb por días hasta llegar a 15 Gb. O sea, sale bastante mejor que la anterior opción. Que no se diga que engaño a nadie recomendando el peor servicio.

Lo bueno de Leechpack es que, además de un número similar de taquillas, permite descargas por Bittorrent. Esto es especialmente útil si eres un inútil que no sabe no sabes configurar el Bittorrent o si estás en una red (o con un proveedor como Ono) que no permite el tráfico Bittorrent. Pegas el archivo .torrent (el enlace) en la aplicación y esta empieza a descargar el archivo al servidor. Una vez acaba, lo tienes listo para la descarga directa. Leechpack te da 60 Gb al mes (=2 Gb al día) y cuesta 7 euros al mes. Algo más caro que el anterior, pero te puede compensar lo del Bittorrent y además te gestionas los 60 gigas para usarlos como quieras.

Obviamente, en todos estos servicios, si te suscribes de golpe a varios meses en lugar de a uno, la suscripción mensual es más barata. Vigila bien lo que contratas, que en varias modalidades te pueden volver a cobrar automáticamente. Todos los servicios te permiten hacer una cuenta gratis para que pruebes el servicio con crédito limitado. Una vez más, cuidado no te cobren automáticamente una vez se acabe el periodo / crédito de prueba. Para resumir, caveat emptor y si tienes problemas, a mí no me mires.

"Pero esto es un blog de traducción. ¿De qué le sirve todo esto al traductor?" Más bien de poco, pero es que esto también es un blog de tecnología (lo pone bien clarito) y esta entrada tiene la etiqueta "OT", no de Operación Truño, sino de Off-Topic, o "Me voy por los cerros de Úbeda, ¿pasa algo?".

Actualización 30/06/2011: Ayer por la noche caducó mi cuenta mensual de Downloadnow. Creía que el 1,5 Gb que me quedaba por consumir seguiría disponible y, simplemente, dejarían de añadirme 1 Gb diario, pero no. Me han desactivado la cuenta hasta que vuelva a pagar (no pienso volver con ellos, claro). Parece que las otras metataquillas actúan de la misma forma, pero Leechpack al menos no pone límites al tráfico que puedes acumular. Es decir, mientras pagues las mensualidades, te van añadiendo 60 Gb de tráfico lo gastes o no. Imagínate que pagas por tres meses y los dos primeros casi no gastas tráfico. Pues al tercer mes tendrás el crédito acumulado de los dos meses anteriores más el mes actual.

lunes, 20 de junio de 2011

Contenidos digitales físicos y etéreos: los videojuegos de Steam

Cuando, hace dos meses, decidí montarme un nuevo ordenador de sobremesa, decidí prescindir del lector óptico, también conocido como "grabadora de deuvedeses". Llevaba más de un año con un netbook y no lo había echado en falta. Mi colección de pelis, álbumes y, en menor medida, cómics y libros están cogiendo polvo. Si quiero consumir cultura, lo hago de forma digital, que engorda menos y es bueno para el cutis. En diez años me he mudado de casa diez veces y no puedo estar cargando con cajas llenas de trastos. Ahora con un par de discos duros externos me apaño para mi cultoteca.

Libros donados a la biblioteca
Más libros donados a la biblioteca
Tengo incluso un escáner con alimentador automático de documentos (ADF) para ir digitalizando los libros que no han digitalizado ya otros. Sí, guillatinándoles el lomo y pasando las páginas de treinta en treinta. No tengo afecto a los soportes de información, no me pone cachondo veo placer en sobar las tapas u oler el papel impreso, al contrario que a muchos detractores del ebook.

Películas obsoletas tiradas a la basura

Esta foto tiene su explicación. En la basura se ven los discos originales (en CD) y en la caja se ve un DVD grabado con el juego pirateado de Internet. Así me ahorro andar cambiando discos y tengo una versión funcional, ya que los CD no funcionaban por alguna razón. Sí, el pirata tiene una mejor versión que el usuario que compró el juego en su día y no sabe hacer estas cosas. La caja con su DVD la guardo (de momento) por su valor sentimental, pero me guardo como versión jugable la que se puede descargar gratis desde la página de FX Interactive hasta el 30 de junio.

El caso es que el jueves 16 me enteré de la salida del Hollywood Monsters 2, una aventura gráfica de los españoles Péndulo Studios continuación de un clásico del 1997. Raudo y veloz me conecté a Steam, una plataforma digital de videojuegos, para ver si ya estaba disponible. Y sí, ahí está, pero no está en español, vale el doble que en DVD y no sale hasta el 21 de abril de este año. Vale, entiendo por la fecha de lanzamiento que todavía no ha salido. Sin embargo, ¿por qué vale el doble la versión digital que la versión en disco, con su caja, su manual y sus cositas? ¿Y por qué no está en español, precisamente siendo este un juego español?


Decidí escribir a FX Interactive, sus editores en España y otros países, para saber qué estaba pasando. Contestaron muy rápido, eso no se les puede negar, para decirme que si lo quería en español tendría que comprarlo en formato físico. De la fecha y el precio no dijeron nada, pero, como no me interesa comprarlo si no está en español, eso ya me da igual. ¿Qué razones puede haber para que no lo quieran vender en español con descarga digital? ¿Quizá que en España quieren venderlo a 20 euros mientras que en otros países pueden permitirse venderlo a 40 euros? No creo, Steam permite establecer precios distintos según la región e incluso denegar la venta a ciertos países.

También pregunté a FX Interactive si podía comprar el juego en DVD, irme a un cíber y hacer una imagen para jugar en casa sin tener unidad óptica. Me dijeron que no, que el disco tiene protección anticopia y no puedo usar el juego como me venga en gana necesito tener instalar el juego desde el disco físico. Y además, en los requisitos mínimos ya pone bien clarito que hace falta una unidad lectora de DVD para poder jugar.

¿Cuál es la razón de que no quieran equiparar la versión física con la versión etérea? Me temo que estamos ante un nuevo caso de suicidio empresarial. Sí, amigos, muchos editores deciden dispararse en un pie jodiendo a sus clientes. Ven que su vida no tiene sentido, que no son necesarios, o al menos son menos necesarios que antes de Internet y dicen "adiós mundo cruel". Quiero que compres un disco, no un juego. Quiero que compres un tomo, no un ebook. No quiero que uses Netflix o Hulu porque eres un sucio español pirata. Quiero que pagues más por un ebook que por el libro en papel. Esta película solo puedes verla donde yo te digo. Y así, ad inifinitum.

Al parecer, el síndrome del suicidio editorial viene ocasionado por una aflicción previa: la controlitis aguda. Creen que siguen teniendo el control sobre sus contenidos digitales. No entienden que, si no me dejan acceder a su producto en condiciones justas, me pueden perder como cliente. Si el juego estuviera en Steam en español y al mismo precio que la versión en DVD (nótese que no pido mayor descuento, 20 euros por un videojuego para PC me parece un precio justo), lo hubiera comprado al momento. Un impulse buy de esos que tanto les gustan a los comerciales, una compra sin pensar. Como no pudo ser, tengo otras aventuras gráficas para jugar, otros libros que leer... No me falta entretenimiento. Sin embargo, el Hollywood Monsters 2 tiene muy buena pinta, así que le he dicho al Google Calendar que me avise dentro de dieciocho meses para ver si el juego ya vale 10 euros, en cuyo caso lo compraré en DVD, dejaré tirado el disco por ahí y me lo bajaré pirata de Internet.

viernes, 17 de junio de 2011

Crónica de una subtitulación asistida

Tengo un pasado como fansubber. Durante la carrera traduje y subtitulé tres miniseries basadas en novelas de Terry Pratchett, dos de ellas de animación y una de imagen real. Lo hice por gusto, para difundir el mensaje del Maestro allende los mares (el Cantábrico, concretamente). Desde que acabé la carrera, han salido tres películas para TV más basadas en novelas de Sir Terry, pero estas ya no las subtitulé por falta de tiempo. No pasa nada, otros tomaron el testigo.

El lunes 13 se emitió por la BBC2 Choosing to Die, un documental sobre la muerte asistida, también conocida como eutanasia, en el que el escritor Terry Pratchett, que sufre de Alzheimer, habla con personas que quieren acabar con su sufrimiento antes de que este acabe con ellas. Dolencias neuronales motoras, escleroris múltiple, Alzheimer... El documental muestra la muerte de un señor que sufre de una dolencia neuronal motora, de ahí que haya levantado una gran polvareda.

Como ahora tengo demasiado tiempo libre, decidí encargarme de la subtitulación, recuperando mi pasado fansubber. En ocasiones anteriores, una hora de metraje me habría costado fácilmente cuatro o cinco días de trabajo, pero esta vez lo empecé el martes por la mañana y lo acabé el miércoles por la tarde. ¿A qué se debe esta mejoría?

Primero, ahora tengo más experiencia traduciendo y voy más suelto que en la carrera. No creo ser mal fansubber, pero desde luego me queda mucho antes de poder dedicarme a la traducción audiovisual profesionalmente. Mi amiga Irene ya me corrigió la tercera miniserie y sabe que no soy un lince precisamente en estas lides. Segundo, he ido a todo gas trabajando más de diez horas diarias dos días seguidos. Esto es algo que no podía hacer en la universidad porque no estaba acostumbrado a tal carga de trabajo: en la universidad nos tratan demasiado bien.

Tercero, esta vez he usado un programa muy chulo, VisualSubSync, que me ha permitido subtitular al mismo tiempo que traducía, además de automatizar parte de los controles de calidad. Cuarto, he pedido ayuda  y obtenido la colaboración desinteresada de colegas vía twitter con mejor oído que yo para descifrar unas cuantas frases de ingleses con problemas de vocalización.

Veamos los puntos tercero y cuarto en más detalle.

En su día, primero traducía en un documento de texto sencillo sin pautar los subtítulos ni poner tiempos y luego sincronizaba el texto con el audio con un programa muy simple. Más o menos, esto es lo que hacen los profesionales del ramo, pero muchos fansubbers sincronizan al mismo tiempo que traducen. O al menos parten de los subtítulos originales, por lo que la labor de sincronización se reduce a adaptarlos a la lengua de destino.

En su día no lo hacía todo a la vez porque no me aclaraba, pero con VisualSubSync es un placer. Vas a la onda de audio, clic y comienza el subtítulo, clic y acaba el subtítulo, clic y creas el subtítulo. Traduces.


Nótese en la barra de estado (abajo del todo) información sobre la longitud de cada línea de los subtítulos y el tiempo que aparecerán en pantalla. Me puse como máximo por línea 35 caracteres, incluyendo espacios. En esta captura no se ve, pero más adelante cambié el tipo de letra a una monoespacio (Courier New) para que cada carácter ocupase lo mismo y pudiera darme cuenta con un golpe de vista si alguna línea ocupaba demasiado.
En cuanto al tiempo que cada subtítulo aparece en pantalla, el programa calcula la desviación (configurable) entre el tiempo idóneo de lectura y el real por el número de caracteres de cada subtítulo y muestra un mensaje con el resultado en la barra de estado. Si dice "Good" o "Perfect", entonces todo va bien. "A bit too fast" y "A bit too slow" a veces son aceptables, pero conviene revisarlos. Los demás mensajes, "Too slow" y "TOO FAST!", no son aceptables nunca. Obviamente, puede alterarse el tiempo que aparecerá el subtítulo en pantalla o cambiarse la traducción.

Durante el documental, un taxista con una dolencia neuronal motora (casi no puede moverse) le dice a Sir Terry que sigue siendo taxista, pero ahora "de cabeza". El Hombre del Sombrero decide ponerle a prueba pidiéndole que le lleve al Atheneum Club de Londres y el taxista le va cantando el recorrido. El taxista en cuestión, muy cockney él, no es muy amigo de la vocalización y que se ponga a decir un nombre propio tras otro no facilita la comprensión, más aun si no te conoces Londres al dedillo.


Sí, señores, tuve que hacer el recorrido en Google Maps buscando la dirección exacta del hospicio donde vive, poniéndolo como origen y el club ese como destino. Luego, las pocas calles que conseguía descifrar las fijaba como parada en Google Maps y veía por dónde tenía que pasar el taxi mental del buen señor buscando calles que sonaran igual. Lo más divertido es cuando se refiere a dos calles de Londres por un nombre que no es el oficial, sino el que usan los londinenses... Toda una fiesta.

Javier y Verónica se ofrecieron amable y desinteresadamente a descifrar ocho frases que no podía entender por mucho que lo intentase. Un servidor acabó descifrando una en un momento de inspiración, Verónica descifró otra... y Javier descifró el resto. Qué gallego más testarudo, no paró hasta que resolvió la última frase. :D Muchísimas gracias a los dos, en serio.


El programa tiene un servidor web fácilmente configurable (inicia el servicio, redirige el puerto en el router y a correr) para que tus colaboradores puedan ofrecer sugerencias sobre la traducción. La captura anterior es la web que ven ellos, pueden escuchar el fragmento de audio correspondiente a ese subtítulo e introducir su sugerencia. Creía que esto sería suficiente como contexto, pero al final necesitaron visionar parte del documental porque los clips de audio eran demasiado cortos. En cualquier caso, una función muy útil e interesante lo del servidor web casero.

Finalmente, con todo traducidito, tocaba la revisión. El documental es muy duro y tuve que verlo cuatro veces: visionado inicial "por gusto", traducción, revisión y control de calidad final. Durante la revisión me concentré en detectar fallos releyendo el texto sin pensar en los tiempos.


Para el control de calidad final, el programa incluye ciertos controles automatizados que puedes activar y desactivar a tu antojo y, en parte, cambiar los umbrales de error. Este control de calidad lo hice después del visionado final, para corregir ciertos errores que yo no consideré errores. No todos leemos a la misma velocidad y yo tenía el hándicap de conocerme de pé a pá el vídeo. A veces está bien que te corrija una máquina. Detecta subtítulos que se chafan unos a otros, que duran demasiado o demasiado poco, con demasiado texto y con demasiadas líneas. Todo editable.

Cuando ya no tenía nada más que corregir, subí los subtítulos de Choosing to Die y lo anuncié en Twitter. Espero haber conseguido difundir el mensaje de Terry Pratchett sobre un debate muy necesario en la sociedad.

Vale, ahora ya me podéis felicitar por ese gran juego de palabras que es el título de esta entrada. Seguro que soy el primero en jugar con esa novela para un título.

Edito a las 23.45h: He buscado cómo se llama el programa que utilicé del 2002 al 2006 para subtitular las tres miniseries. El Manual Video Subtitler (una guía de muestra) servía para cargar un archivo de texto con los subtítulos ya separaditos y sincronizarlos con un vídeo. La interfaz consistía en cuatro botones: Ir a subtítulo, Comienza subtítulo, Acaba subtítulo y Pasar a siguiente subtítulo, todo ello con cómodos atajos de teclado. Por $Deity, cómo ha mejorado la cosa desde entonces.

Edito el 28/05/2012: Choosing to Die se ha llevado un BAFTA 2012 al mejor documental. Estoy orgulloso como si se tratase de un hijo mío.

jueves, 26 de mayo de 2011

Los piratas también son consumidores

Leo en este blog sobre un estudio de los hábitos de piratería de libros. El titular es que las mujeres de más de 35 años son las que más piratean libros.


Ese estudio solo ve lo que le interesa. Me parece lógico que las mujeres de más de 35 años sean las que más piratean libros... porque son las que más leen. Nadie lee más que una adicta a la literatura romántica (fantasía urbana romántica, novela histórica romántica, etc). Y si son las que más leen, me parece lógico que sean las que más compran libros además de piratearlos.

Tengo conocidas en Goodreads, Libroselectrónicos, Mobileread y demás que leen una barbaridad de libros, más de 100 al año sin problema. Puedes comprar mucho, pero gastarte, digamos, 10 dólares por libro a 100 libros al año... 1000 dólares en libros es una pasta. Así que compran lo que pueden y lo que no, se lo descargan gratis.

¿Cuál es el problema? ¿Que piratean mucho? No, eso es una consecuencia del problema. El problema es que nadie les ofrece lo que ellas necesitan y, por lo tanto, se buscan la vida como pueden. Podrían ir a la biblioteca y sacar el libro gratis, pero es más cómodo leer la versión digital.

La tienda Fictionwise era famosa por su club de lectores. Comprabas un libro y te daban crédito para comprar otro. Sus precios no eran más baratos que otras tiendas, de hecho a menudo eran ligeramente más altos. Pero te compensaba si comprabas mucho. Comprabas un libro que vale 10 y te daban un crédito de 1. Comprados 10 libros, el número 11 te salía gratis. Así fomentaban la fidelidad del cliente y el consumo. ¿Qué pasó? Las idiotoriales les lanzaron sus perros abogados y les obligaron a eliminar este club de lectura. ¿Consecuencia? Muchos consumidores dejaron de ir a esta tienda como protesta. Y no han vuelto. Pérdida de beneficios.

Para este tipo de consumidores sería mejor una modalidad de suscripción, rollo Spotify. Pagas, digamos, 20 dólares al mes y tienes acceso a todos los libros que quieras. Te los descargas y te duran 30 días. Si pasados 30 días no validas que sigues suscrito, se borran. Magia. Ale, dejo esta oportunidad de negocio para quien la quiera recoger. Aquí hay pasta, a ver cuál es la editorial que se atreve a dar el primer paso.

martes, 19 de abril de 2011

Hasta luego y gracias por el pescado

Un autónomo que solo necesite un PC con conexión a Internet para su trabajo y que no tenga compromisos familiares (pareja, churumbeles) tiene muchas posibilidades para cambiar su vida a mejor.

En las tarjetas de visita de autónomos pocos ponen su dirección. Bueno, en muchos casos la dirección de la oficina de uno es su propia casa y eso no se comparte tan alegremente. Pero es que además llevamos la casa a cuestas: podemos hacer tantas mudanzas como queramos y masocas seamos. No estamos atados a una empresa a la que acudir de lunes a viernes.

No creo que seamos muchos los que decidimos liarnos la manta a la cabeza e irnos a la otra punta de España (o a otro país) para trabajar desde casa. Están los que viven en casa de sus padres, los que siguen el trabajo asalariado de su pareja, los que se mudan a una ciudad cercana a su pueblo... Yo he decidido dejar la casa paterna de Benidorm (Alicante), para irme a Gijón (Asturias), donde llevo ya unas semanas viviendo. Estoy muy loco, sí, me lo dicen los asturianus que se enteran de mi decisión de abandonar el sol para irme a la lluvia.

¿Por qué tan lejos?

El tercera rueda lúser dice AWESOME!
Mis amigos del pueblo, a los que conozco más de media vida, tienen su vida más o menos encaminada. Tienen parejas estables y buen futuro laboral. Cuando salimos a cenar, vamos mis dos amigos, sus parejas y yo. Soy una "tercera rueda" (quinta, en mi caso), como dicen los yanquis, o un aguantavelas como se dice en España. Hay que ser ciego para no ver que esta situación es insostenible. Es normal, nos acercamos a los treinta años y uno cada vez tiene menos tiempo para los amigotes y debe centrarse en la vida familiar, aunque los hombres intentemos huir de estos compromisos. Además, para alguien que ha vivido lejos de sus padres durante nueve años, supone un trauma pasarse casi un año en casa, mantenido.

En resumen, necesito una terapia de choque, algo que me obligue a espabilarme. Aprender a nadar o hundirme. Un cambio radical, una tabula rasa, reinventarme a mí mismo. Necesito nuevos aires, los aires del norte.
Aquí los WarCry con su melena al viento del norte (asturiano)
Escoger una ciudad
No tiene sentido que alguien que va a trabajar desde casa y no depende del contacto físico para tratar con sus clientes escoja una gran ciudad para asentarse. El coste de vida es demasiado alto. Hay que ser algo ciego para establecerse de autónomo en Suiza, sin ser suizo. Lo mismo va por Madrid, Cataluña o el País Vasco. Descartadas.

En un documental oí hace un par de años que las comunidades españolas con las casas más baratas eran Asturias y Extremadura. Por ahí empecé. Abrí un mapa digital y empecé a añadir ciudades pequeñas o medianas a la lista. Gijón, Avilés, Oviedo, Cáceres, Mérida, Badajoz, León, Salamanca, Valladolid, Santander. Ahora mismo no recuerdo por qué no incluí Vigo o Santiago.

Primero vi el transporte: las conexiones con mi familia y con destinos importantes. Un aeropuerto "no fantasma" con aerolíneas de bajo coste. Buena línea de tren de larga distancia, con cercanías si es posible. Frecuencia, tiempo total y coste, transbordos incluidos, sea de tren o de avión (o de bus para los paticortos). Hay que mirar la letra pequeña, porque luego te encuentras sorpresas como que el aeropuerto de Asturias ha eliminado más de la mitad de vuelos internacionales para la temporada 2011, casi nada: Bruselas, Praga, Lisboa... El tren suele ser más estable que el avión en su oferta. En Aena hay información sobre las rutas y aerolíneas que operan en los distintos aeropuertos, luego es cuestión de buscar vuelos concretos.

Luego miré la oferta de pisos que se ajustaran a lo que yo buscaba. El número total que entraran en un rango de precio, de tamaño (un soltero no quiere tres habitaciones), de situación, etc. Hay varias herramientas útiles para filtrar resultados rápidamente: Fotocasa, Pisos, Enalquiler...

A continuación consulté, vía la Wikipedia y webs de ayuntamientos, la población y especialmente el porcentaje de población joven. El poco turismo que consigue Benidorm en los dos últimos años consiste en abuelos del IMSERSO, jubilados europeos y guiris de desfase de fin de semana. Por lo demás, el pueblo está muy desierto y da penita, aunque supongo que a partir de semana santa se irá recuperando. Si hay población joven, hay oferta cultural. Busqué el número de teatros y salas de cine (carteleras de diarios, servicios de compra de entradas), si había cines de barrio (para las pelis clásicas y minoritarias) o filmoteca, si había oferta de cine en versión original... También es muy relevante la oferta de cursos, talleres y los polideportivos públicos (piscina, clases de mantenimiento físico), algo vital cuando no conoces a nadie en una nueva ciudad.

Más adelante comprobé la temperatura media a lo largo del año, la mínima en los meses de invierno y la máxima en los meses de verano vía Protiempo. Y para acabar, el último dato: las cervecerías de calidad. Cervezas raras de importación, cerveza artesanal... ¡La cerveza es vida y cultura! Para esto hay que tirar de blogs cerveceros, como Lúpuloadicto.

Recopilación de datos por ciudades
Vale, ahora mezclo todos los datos, agito bien y ¿qué tengo? Un lío impresionante. A veces los datos numéricos hacen fácil descartar una ciudad por un motivo importante, pero a menudo varias están empatadas o no hay un dato numérico claro. Entonces puede usarse el clásico método de los dados, la diana o el pito-pito-gorgorito. Descarté unas cuantas ciudades con métodos (pseudo)científicos, pero no podía decidirme entre Salamanca y Gijón. Pides consejo a amigos que han vivido ahí, que viven allí, pero no es fácil.

Ahora que llevo unas semanas viviendo en Gijón me doy cuenta de que quizá Gijón no es Asturias por lo que se refiere al coste de vida. Sigue siendo moderadamente barata, pero Gijón es una ciudad de tamaño medio, con lo que los precios no pueden estar muy bajos. De todas formas, estoy contento con mi decisión.

Ahora el manual del buen bloguero me indica que tengo que pedir la intervención del lector. No, en serio, de verdad que me interesa. ¿Soy el único loco que da tantas vueltas para decidir una ciudad en la que establecerse? ¿Hay algún foro por ahí con gente de culo inquieto que quiere cambiar de ciudad e intercambia información y consejos? Algo rollo Spaniards, pero sin salir del país.