Medias y medianas en el Banco de España

Los patriotas españoles del siglo II a.C. peleaban por la estepa lusitana contra los romanos y abominaban del alcantarillado y los acueductos. Los del siglo XVI, seguían el caminar del sol sobre el azul del mar para blanquear un subcontinente con el empuje de sus caderas. Los del XIX fusilaban a alcaldes liberales en las plazas de las villas altonavarras.

Y los españoles patriotas de junio de 2012 leemos el informe de estabilidad financiera del Banco de España. ¿Qué encontramos en él? Aparte de un poco de graficaca, como en el siguiente ejemplo

La prehistoria de R, según Patrick Burns

R

Para muchos de nosotros, R es algo del siglo XXI. Patrick Burns, sin embargo, es capaz de estirar la memoria hasta hace casi 30 años, 1984, momento en el que S, que era entonces un proyecto experimental de los laboratorios Bell, salió al mundo.

S evolucionó hacia S+ entre 1984 y 1992. Al aparecer R, la situación era aproximadamente así:

Y, de hecho, en las primeras versiones de R, el código (extraído del artículo R: Lessons Learned, Directions for the Future de Ross Ihaka) tenía esta pinta:

Curso de R gratuito no presencial

R

Hace unos diez años aprendí R por mi solo y por mi cuenta. Entonces era una rareza y no me constaba que en mi universidad hubiese nadie trabajando con él.

Diez años después, R ha cobrado tal importancia que son muchos los interesados en aprenderlo. Para subvenir a esta demanda, Juanjo Gibaja y yo hemos diseñado un curso de R básico con las siguientes características:

  • Es gratuito.
  • No da derecho a diplomas o certificados de ningún tipo.
  • No es presencial.
  • Plazas ilimitadas.
  • Está basado en el autoestudio: cada participante tendrá que leer y trabajar por su cuenta.
  • Es colaborativo: hemos desarrollado una plataforma web para que quienes sigan el curso puedan plantear preguntas y, como parte fundamental del programa, tratar de responder las de sus compañeros.
  • Está supervisado por Juanjo y yo: nos encargaremos del programa, de dar soporte de última instancia a las preguntas abiertas por los estudiantes.
  • Es genérico. Cada cual quiere aprender R por un motivo distinto: unos, para analizar encuestas; otros, por su interés en la minería de datos; algunos, para analizar series temporales,… El curso está pensado para llevar a cada cual hasta el mismo umbral de su tema de interés de forma que pueda después de él avanzar en el tema por su cuenta. Pero sin hacer especial hincapié en ningún asunto concreto.
  • El contenido estadístico será mínimo (se limitará a algo de estadística descriptiva y poco más).

Los interesados encontrarán más información en este documento.

Competición en Forbes: y el peor gráfico es...

… este:

Está hecho con Excel y representa los números 2, 4, 6 y 8. De acuerdo con la página en la que se anuncia el resultado del concurso,

los conos tocan el fondo de la figura. La profundidad es un parámetro que puede cambiarse en Excel, pero muchos usuarios lo ignoran. La mayor parte de los lectores subestiman la altura del cono cuando la profundidad no es cero. La forma del cono también tiende a hacer subestimar las alturas.

Deuda y apalancamiento

Hoy, ni estadística, ni R, ni nada de lo que estilo. Me limitaré a mostrar un gráfico sobre la deuda y el apalancamiento en algunas economías notables extraído del último informe del FMI

Aun sin ser experto, se me antoja realizar algunos comentarios:

  • Aunque se tienda a meter a España e Italia en un mismo saco, presentan diferencias notables: Italia tiene una deuda alta; España, baja. Sin embargo, Italia tiene superávit primario (es decir, ingresa más de lo que gasta, por lo que su deuda tendería a reducirse) y España, déficit. Y es por ahí que van los tiros de los famosos recortes… Y por eso también es que últimamente se habla del desacoplamiento entre ambos países.
  • Ah, Alemania… ¿cómo están tus bancos? ¿Sabes que el apalancamiento es una caja de Pandora?
  • ¡Qué fotogénica es la Eurozona! ¿Será que necesitamos más Europa y menos Grecias (así como más España y menos Valencias y Pioces)?

SAP, HANA, RHANA y R

R

SAP es tal vez la mayor empresa europea de software. Aunque es principalmente conocida por sus programas de gestión empresarial, ha hecho sus pinitos en el mundo de los gestores de bases de datos con HANA. Una de sus principales peculiaridades es que almacena la información en memoria, beneficiándose, por un lado, del abaratamiento del hardware y, por el otro, de la velocidad de acceso.

Otra, de mucho más interés para quienes siguen esta bitácora, es la posibilidad de conectarlo con R. He ido recopilando varios enlaces sobre el asunto en los últimos tiempos, como

Desencriptando (II): la avaricia es mala

El otro día propuse y resolví un problema de encriptación con R. Utilizaba uno de los llamados métodos avariciosos (o greedy) para hallar el máximo de una función (que era, en esencia, la función de verosimilitud de una determinada permutación de caracteres dentro del espacio probabilístico de todas ellas).

Este método funcionó con una cadena relativamente larga para desencriptar pero falla con otras más cortas. Por ejemplo, con

cadena <-c("u","r","i","b","y","r","l","g","m","h","e","r","y",
"b","g","m","a","c","p","y","c","m","d","r","h","z","y",
"r","e","i","c","l","r","i","n","e","c","t","d","t","c","z",
"c","y","c","v","r","o","d","y","s","e","r","q","c","y","c",
"n","g","q","c","i","g","m","r","y","d","i","v","r")

Si ejecuto el código que presenté el otro día,

Jugar empobrece

Fumar mata. Cien gramos de barritas de cereales (cuatro unidades) contienen 0.2 gramos de sodio. Y unos carteles amarillos indican que hay que tener cuidado al pisar porque acaban de fregar el suelo. El estado quiere que dejemos de fumar, tengamos una dieta sana y no nos descalabremos.

Pero, ¿por qué no se etiquetan de igual manera las máquinas tragaperras? Un reciente artículo en Significance especula sobre la manera en que poder transmitir información sobre la peligrosidad de estos dispositivos a sus —tristes— usuarios. Porque, curiosamente, así como con la ruleta y otros juegos de azar es posible calcular las probabilidades involucradas, las máquinas tragaperras con particularmente opacas.

Patrones hexagonales con R

R

Navegando por internet di con el gráfico

(que puede encontrarse aquí) además de un enlace al código en Matlab usado para generarlo.

Diríase que lo programó un contable. Tratad de seguirlo y veréis por qué lo digo.

Y por entretenerme, traté de generarlo con R. Y creo que de una manera algo más intuitiva:

  1. Creo una función que sabe pintar un hexágono en una posición dada.
  2. Creo una retícula de centros de hexágonos del tamaño adecuado.
  3. Pinto finalmente un hexágono en cada uno de esos centros.

El código es

La paradoja del cumpleaños y el niño que colecciona cromos de futbolistas

El otro día vi el programa Descifrar las probabilidades en la vida de Punset en el que se repasan varios problemas más o menos prácticos en los que el cálculo de las probabilidades juega cierto papel.

Entre ellos menciona el de la llamada paradoja del cumpleaños: resulta que si 23 personas se juntan en una fiesta, existe aproximadamente un 50% de probabilidades de que dos de ellos tengan el mismo cumpleaños. Por algún tipo de defecto de diseño cerebral, al ser humano se le antoja un resultado paradójico. Leí también a Esteban Moro en Twitter decir que él explica mejor ese fenómeno en charlas sobre probabilidad que da en institutos, creo recordar.