Predictores con varianza casi nula, inflación, loterías y línea de comandos

Hoy viernes vuelvo a traer a mis páginas cuatro enlaces interesantes. El primero de ellos es como las malas películas: un arranque espléndido, un planteamiento prometedor y, al final, humo. Pero no trata de chico-conoce-chica sino de qué hacer con esas variables que tienen una varianza casi nula (a la hora de crear modelos estadísticos, se entiende). Me llegó tan oportunamente que pensé que alguien que vela por mí desde lo alto me lo enviaba para sacarme de mi semanal atolladero. Pero no fue el caso.

El segundo habla de la medición de la inflación y en particular, de cómo construir indicadores más útiles y significativos para los interesados (y afectados). Es interesante sobre todo porque pone de manifiesto las hipótesis subyacentes, los debates metodológicos, las opciones disponibles para calcular ese numerito que periódicamente aparece en los titulares con aura de verdad incontrovertible.

El tercero es una cura de humildad similar a cuando constaté que no había sido yo el inventor del puré de patatas con salchicha (eso sí: que conste que fue una invención independiente). Llevaba mucho tiempo pensando en que en un país tan dado a la lotería como España sería un buen instrumento contra el fraude el poder canjear el importe de las declaraciones positivas del IRPF, el IVA de las facturas del fontanero y similares por billetes de lotería de navidad. Y resulta que la cosa ya existía.

Y el último de hoy se lo dedico a un lector —que no quiero nombrar— de la particular opinión de que eso del big data es otra cosa que la estadística de toda la vida aplicada a la salida de guiones de awk. Se trata de esta colección de siete herramientas de línea de comandos para el análisis de datos. Quería haberlas probado todas para poder escribir sobre sus virtudes pero, señores, no me da la vida. Así que si alguien se presta…