Así las gastan otros INEs

Este vídeo es una entrevista de la BBC a

que hablan en ella de políticos que hacen referencia a hechos imperfectos.

Y, ¿sabéis qué? Resulta que el INE británico envía cartas a políticos de todos los colores en los que les recrimina el uso inadecuado de cifras y datos. Y no solo las envía, sino que las publica. ¡Increíble!

El carajal de las representaciones gráficas de "redes sociales"

Seamos honestos: en representaciones gráficas de grafos similares a

no vemos/entendemos un carajo. Al menos yo.

Es cierto que de vez en cuando los fabrico. Y que aquellos a quienes se los enseño con la cara muy seria, asienten (o, incluso aplauden) por algún motivo. Sospecho que porque piensan que el emperador está vestido (y no en porretas, como parece que les da pudor reconocer).

Afortunadamente, hay quienes han asumido el problema (de la falta de interpretabilidad, consecuencia del exceso de información irrelevante de ese tipo de representaciones) y están proponiendo soluciones. El vídeo

Mis copias de seguridad

Por referencia mía y de otros, voy a dejar acá escrito y explicado cómo gestiono mis copias de seguridad. Porque los discos duros se rompen y los ordenadores desaparecen. Etc.

Primero, mi instalación: tengo un ordenador de bajomesa (tiramisu) y un netbook (kropotkin). Ambos corren la misma versión de Xubuntu, la última estable.

Mi primera línea de defensa contra las pérdidas de información es la sincronización de ambas máquinas. Aquellos directorios que contienen cosas que no quiero perder (documentos, fotos, código, ¡copias de seguridad de otras máquinas, incluido esto que lees ahora!, cosas que no son documentos en desarrollo, etc.) se guardan en el directorio .bck de ambos ordenadores. Los directorios que veo son enlaces blandos (vía ln) a subdirectorios de .bck.

Mapas, mapas, mapas... ¿y?

No paro de decir para mis adentros “¿y?” según hojeo el recién publicado Atlas de mortalidad en municipios y unidades censales de España.

En el prefacio del estudio se lee:

En sus páginas encontrará los reflejos de las construcciones sociales que condicionan las oportunidades de salud y bienestar de las personas, mostrando que el espacio para políticas de reducción de desigualdades sociales en salud es amplio.

Pues no, no encuentro reflejos de construcciones sociales. Lo que encuentro son áreas administrativas. Las construcciones sociales que ocurren dentro de dichas áreas administrativas brillan, si acaso, por su ausencia.

Tres grandes números (con enmienda)

El otro día hablé fatal sobre tres grandes números. Casi me da pudor releer la entrada. Es una flagrante violación de principios que he defendido aquí o http://www.datanalytics.com/2011/01/12/el-precio-del-petroleo-reflejo-del-anumerismo-de-la-prensa/.

Así que donde escribí 40.000, 57.000 o 27.000 millones de euros, debí haber escrito 851, 1.595 o 574 euros por barba.

Creo que de esta manera quedan bastante más claras (y ciudadanizadas) las magnitudes de las que hablé.

¿Suben o bajan?

La respuesta es sí, obviamente. Pero no todo el mundo maneja la lógica retorcidamente y aplicado a la mediana de los salarios estadounidenses los más comenzaríamos a hacer distingos en lugar de encerrarnos en la tautología.

Leo en Revolutions cómo dicha mediana ha crecido un 1% anualmente desde el 2000. Pero, a la vez, la mediana ha descendido en cada uno de los grupos definidos por el nivel de estudios (sin, bachillerato, universitarios, etc.).

¡Qué solazo anoche!

Pues sí, anoche debió hacer un buen solazo. Yo dormía y no lo vi, pero lo deduzco de lo que me cuenta Red Eléctrica:

Véase cómo a eso de las cuatro de la mañana la producción de energía catalogada como solar era de 360MW.

Habida cuenta que el KWh solar se paga a un precio elevado (y que pagamos/pagaremos todos) a uno se le ocurren unas cuantas preguntas:

  • ¿Cataloga mal REE el origen de la energía?
  • ¿Se está quemando gas en las centrales solares?
  • ¿Hizo sol anoche?

Y una nota para que nadie piense que no he hecho los deberes. Y que sirve para arrojar algo de luz sobre un asunto que muchos desconocen.

Medianas ponderadas en R

La mediana de 1:3 es 2. Pero puede ser que queramos dar a 1:3 los pesos 2, 1, 2. En ese caso, el cálculo de la mediana sigue siendo sencillo (y sigue siendo 2). Pero la situación puede complicarse más.

Mientras los pesos sean enteros, todavía pueden usarse trucos:

x <- 1:3
pesos <- c(2,1,2)
median(rep(x, times = pesos ))

¿Pero qué hacemos cuando hay pesos fraccionarios? Bueno, en realidad, podemos ordenar:

n <- 1000

x <- runif(n)
pesos <- runif(n)
o <- order(x)
x.o <- x[o]
pesos.o <- pesos[o]
x.o[min(which(cumsum(pesos.o) > .5 * sum(pesos.o)))]

Pero me parece más limpio usar el paquete quantreg:

Quiero violar la ley y no sé cómo

He decidido violar la ley. Quiero demostrar al mundo y a mí mismo que no me es necesario transitar aborregadamente las sendas de los cobardes que tanto temen a Dios y al alguacilaje.

Por especificar, he optado por ponerme al margen de la ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público. He navegado hasta su artículo 11, titulado régimen sancionador y me he dispuesto a cometer las infracciones que estima más graves. A saber:

Lo relevante, arriba y a la izquierda

No es lo más importante del mundo. Pero considero una descortesía de un tabulador de datos para con sus usuarios que no ponga la información más relevante arriba y a la izquierda.

Por ejemplo, en el último Informe Trimestral de la CMT uno encuentra la información así:

No es terrible, pero la información que más a mano aparece es la menos interesante, la del 2005. Para ver el último dato hay que desplazarse (i.e., hacer scroll) hasta el fondo a la derecha.