Datanalytics

Archivo

Entradas Etiquetadas ‘anumerismo’

Me siento reivindicado

Martes, 19 de febrero de 2013 1 comentario

Sí, hoy me siento reivindicado. En efecto. El otro día escribí una entrada titulada ¿… coma cero dos por ciento? ¡Anda ya!. Y hoy Andrew Gelman, abundando en los mismos temas, titula la suya “1.7%” ha ha ha.

¿El tema de fondo? La obsesión enfermiza por la precisión y ese miedo atávico a la variabilidad y la incertidumbre que acompañan naturalmente a los fenómenos cotidianos.

Cultura numérica, incultura numérica

Martes, 30 de octubre de 2012 Sin comentarios

Traigo hoy dos enlaces relacionados a mi bitácora.

No sé si conocéis OWNI, un Objet Web Non Identifié. Una de sus tres secciones prominentes se llama Cultures Numériques. No datos. No periodismo de datos. No OpenData. Sino culturas numéricas (supongo que el plural es un brindis a la ultracorrección política). Que tal sea el nombre invita a reflexiones que habrían de germinar por sí solas en las mentes de mis lectores.

El segundo tiene esta entradilla (con mi traducción):

El miedo a los números te deja a merced de los políticos, los medios y las empresas, de acuerdo con la Academia Británica. Su presidente, el profesor Sir Adam Roberts, afirma que la falta de habilidades numéricas te hace vulnerable a la malinterpretación y a la toma de decisiones equivocadas. ¿Son tus habilidades numéricas suficientes para defenderte de los argumentos engañosos de los políticos y los vendedores? Haz nuestra prueba de conocimientos estadísticos para averiguarlo. Cada pregunta mide tu capacidad para sortear falacias numéricas y estadísticas cada vez más sutiles.

¿Quieres hacer esa prueba? Aquí está.

El precio de la desigualdad (i.e., el bosón de Higgs y fracciones)

Viernes, 6 de julio de 2012 3 comentarios

Esta semana me he enterado (con un mes de retraso, ¡qué vergüenza!) de que Stiglitz ha publicado un nuevo libro: El precio de la desigualdad. Se ve que en él argumenta el nóbel cómo esta no solo es mala para la economía sino que también afecta a la democracia.

Se refiere, por si alguien no se había dado cuenta todavía, a la desigualdad económica… pero…

— Buenos días, señor mileurista.
— Buenos días tenga Vd.
— ¿Le apetecería un incremento de su sueldo en un 15 %? ¿Una bajada del IVA, tal vez?
— ¡Venga!
— Y qué prefiere, un 50 % más de café gratis o un descuento del 40 % en el precio del paquete de a kilo?
— ¡Me decanto por lo primero!
— Pero, ¡señor mío!, la primera opción equivale a un descuento de un 33 % en el precio… ¡y le ofrecía un 40%! ¿No querrá recibir (y gratis, además) rudimentos sobre fracciones?
— Pues va a ser que no.

Como nuestro mileurista huye, retomo el discurso para añadir cómo me resulta curioso que coexistan democracia y desigualdad económica. La desigualdad económica existe porque —incluso, consiste en que— más de la mitad de la población se ve privada de algo que considera deseable: tener más recursos económicos, vivir más desahogadamente. Podría un marciano inteligente pensar que los terrícolas solo se avendrían a padecerla bajo regímenes dictatoriales, pero jamás si los gobiernos pudieran ser desalojados en elecciones en que cada persona contase con un voto. Pobres los marcianos inteligentes: ¡no se enteran de nada!

Pero si la desigualdad económica (y lo dice un nóbel), es mala para la economía sino que también afecta a la democracia, existe otra que es peor aún tanto para lo uno como para lo otro: la desigualdad intelectual, la desigualdad de conocimiento. Y a diferencia de la desigualdad económica, tan indeseada por nuestro mileurista de esa manera suya un tanto burda y primaria, esta se asume con la mayor de las naturalidades y sin que a nadie se le ponga la cara roja.

Esta semana, mientras la prensa nacional e internacional, recogía con insuitada fanfarria (porque guardo el recorte de la noticia del ABC sobre la demostración de Wiles del último teorema de Fermat y es una nota minúscula de papel ya amarillo) lo del bosón de Higgs, me hacía yo eco de cómo la gente no sabe realizar operaciones básicas con fracciones y de qué manera pueden los supermercados y fabricantes de productos aprovecharse de ello para extraerles los cuartos. Y sin un mal retuiteo de mis pocos lectores.

Pero si los hay y si son perspicaces —que, casi seguro, lo son—, se darán cuenta de que algo anda mal, que algo chirría cuando unos cuantos locos en Ginebra son capaces de probar la existencia de los componentes de los componentes de los componentes de los componentes de la materia palpable y conocida mientras los más no sabemos completar una cuenta trivial.

Categories: números Tags: ,

El lucero del alba

Martes, 27 de diciembre de 2011 4 comentarios

Puede que algunos de mis lectores sepan que el lucero del alba es el nombre con que se conoce al planeta Venus cuando es visible en el cielo al amanecer.

En contextos menos poéticos se conoce por tal nombre a esto:

Es decir, una determinada configuración de los precios de apertura y cierre de tres días de cotización (bursátil, por ejemplo) de forma que:

  • El primer día hay una bajada
  • El tercer día hay una subida
  • Los precios de apertura y cierre del segundo día son inferiores a los del cierre del primero y apertura del segundo.

Se ve que eso es cosa güena. De El Economista extraigo el siguiente párrafo atribuido a un tal Joan Cabrero:

Después del fallido intento que protagonizaron los alcistas ayer, hoy la presión compradora sí ha conseguido dominar la sesión de principio a fin, y mucho tendrían que cambiar las cosas para que al cierre de Wall Street los futuros europeos no consigan desplegar un patrón triple de velas que es conocido en el argot técnico oriental como lucero del alba y que sería otro elemento más que apoyaría el giro alcista señalado

Efectivamente, un lucero del alba parece ser indicio de subidas bursátiles.

Y uno se pregunta: ¿en serio? Y si es verdad, ¿por qué? Y como ya somos mayorcitos para no creer todo lo que se nos cuenta, vamos a Yahoo Finance y bajamos las cotizaciones históricas de Telefónica (desde el 2000), por ejemplo, y ejecutamos lo siguiente:

tef <- read.table( "table_tef.csv", sep = ",", header = T )
tef <- tef[ order( tef$Date ), ]

morning.star <- function( block ){

	if( nrow( block ) < 23 ) return( NULL )

	apertura <- block$Open
	cierre   <- block$Close

	if( !(
		apertura[1] > cierre[1] &
		apertura[3] < cierre[3] &
		max( apertura[2], cierre[2] )
			< min( apertura[3], cierre[1] )
		)
	) return( c( 0, rep( 0, 20 ) ) )

	else return( c( 1, ( cierre[4:23] - cierre[3] ) / cierre[3] ) )
}

tmp     <- sapply( 1:nrow( tef ),
		function( i )
			morning.star( tef[ i:nrow( tef ), ] ) )

res.all <- do.call( rbind, tmp )
res.ms  <- res.all[ res.all[,1] == 1, ]

El resultado muestra cómo en los 10 últimos años ha habido 48 luceros del alba. ¿Y qué pasó un mes después? Lo indica el histograma siguiente:

Y en 20 años de cotización del IBEX 35, ¿cuáles serían los resultados? Helos:

ibex    <- read.table( "table_ibex.csv", sep = ",", header = T )
ibex    <- ibex[ order( ibex$Date ), ]
tmp     <- sapply( 1:nrow( ibex ),
                  function( i ) morning.star( ibex[ i:nrow( ibex ), ] ) )
res.all <- do.call( rbind, tmp )
res.ms  <- res.all[ res.all[,1] == 1, ]

Y al cabo de un mes de los 78 luceriles prodigios ocurridos desde el 92, la rentabilidad acumulada por el IBEX 35 fue la indicada en el siguiente histograma:

Ah, Joan, Joan, ¿cuánto te pagarán por no decir nada (útil)?

Categories: finanzas, r Tags: , , ,

Hoy, día del sorteo de la Lotería de Navidad, no se publica entrada

Jueves, 22 de diciembre de 2011 6 comentarios

Hoy, día del sorteo de la Lotería de Navidad, no se publica entrada en esta bitácora como acto de protesta y repulsa frente a la celebración folclórica del anumerismo.

Medias de medias… ¿a estas alturas de siglo?

Jueves, 3 de noviembre de 2011 5 comentarios

Lo sospechaba y ha resultado ser cierto: media de medias. ¡Carajo! El siguiente gráfico que compara la tasa media de paro entre el norte y el sur de España está extraído de El Economista:

¿Cómo se han calculado los porcentajes? Veámoslo (a partir de los datos que aparecen en el artículo); para el sur, promedia las tasas de paro de cada comunidad autónoma así:

> mean( c( 30.93, 29.55, 22.44, 24.73, 23.6, 24.19, 33.2, 23.81 ) )
[1] 26.55625

Operación que, obvia decirlo, sólo sería correcta si la población de todas las comunidades autónomas implicadas fuese, cuando menos, similar (y, p.e., la población de Andalucía fuese comparable a la de Melilla).

Y para el norte, asá:

> mean( c( 16.16, 17.17, 17.81, 14.10, 16.08, 19.43, 17.25, 17.01,
> 11.68, 12.17, 17.39 ) )
[1] 16.02273

Para que no se me ocuse de perpetuo protestador, quiero anunciar que estoy trabajando en un programa (y tal vez paquete) de R que permita importar automáticamente los microdatos de la EPA para que el desmedido talento de los usuarios de R permita desenterrar patrones más interesantes que los que nos regalan mensualmente los periodistas anuméricos.

Categories: números Tags: , ,

Numerismo “interruptus” en el FT

Viernes, 7 de octubre de 2011 Sin comentarios

Cuando era menos pobre, antes de la crisis, me desayunaba todos los días con el Financial Times. Me lo daban gratis en el hotel. Al cabo de un año leyéndome cada letra de cada edición, los principales columnistas acabaron siendo como de la familia.

Un tipo al que tengo insana envidia es John Authers. Estése o no de acuerdo con su punto de vista, el hecho de que cada mañana sea capaz de poner en negro sobre sepia una columna increíblemente inteligente es motivo sobrado para sentirse internamente reconcomido. Otra periodista de asombroso insight (odio no saber traducir el término al español) es Gillian Tett.

A ambos he tenido ocasión de leer en estos últimos días de maletas y aeropuertos, copia en pequeñito de lo que fue mi vida unos pocos años atrás. Y de Star Wars money and cyber finance, la columna de esta última en la edición del 1 de octubre del FT me refiero en esta entrada.

Acierta Gillian en traer sobre la mesa un asunto que nosotros, que tal vez sepamos más que ella sobre el asunto, relacionamos con el anumerismo. Se queja con motivo de que cifras (que son dinero) de tanto cero que aparecen en prensa, etc., han dejado de impactar al público, que ha perdido la referencia de lo que es mucho y lo que es poco.

Menciona el contador electrónico instalado en Times Square de Nueva York instalado por Seymour Durst en 1989 para publicar el tamaño de la deuda estadounidense. Gillian lo vio el otro día marcar 14.613.324.053.350 dólares. Menciona cifras como la de 440 millardos de euros (del fondo europeo de rescate), 14.000 millardos de dólares (el tamaño de la deuda estadounidense, abreviado), o 23.000 millardos de yenes (que vete tú a saber a qué se refiere).

¿Cómo convertir cifras en información (propiamente dicha)? Es tema sobre el que largo he escrito en esta bitácora. Y la solución no pasa por contadores luminosos. Ni por

[...]Algunos grupos cívicos están tratando de comunicar el tamaño de la deuda publicando imágenes de cuanto ocuparían 14.000 millardos en billetes de un dólar apilados sobre un campo de fútbol.

Pasa por utilizar la vieja operación que nos enseñaron en la escuela: dividir. Y utilizando un denominador adecuado, claro. Por ejemplo, la deuda a la que me refiero arriba asciende a 40.000 dólares por estadounidense, cifra mucho más sencilla de interpretar que el siguiente gráfico

que representa el volumen de un montón de billetes de cien dólares que suma el tamaño total de la deuda y que he extraído de aquí.

Una tarea final para mis lectores: ¿cuántos euros por europeo representa la deuda griega de la que tanto se habla estos días en prensa? ¿Cuánto tendríamos que poner cada uno de nosotros encima de la mesa para olvidar tan insidioso asunto?

Cálculo mental, alzheimer, anumerismo y 20N

Miércoles, 5 de octubre de 2011 Sin comentarios

El otro día pensaba yo: si escribiese en un rollo de papel (idealmente infinito) el nombre de todos los españoles, uno en cada línea, de manera que cada línea ocupase, digamos, dos centímetros, ¿cuántos kilómetros de papel me harían falta?

Por redondear, supuse que la población española es de 50M (pecata minuta: de sobreestimarla en un 10%, bastaría con recortar un 10% la respuesta final). Y por azares le propuse el problema a un compañero para que lo resolviese mentalmente. ¡Incapaz! Luego otro, y otro, y otro. Hasta seis y ninguno supo darme una respuesta correcta utilizando sólo cálculo mental.

Puede ser que se sintiesen intimidados y temiesen una objeción capciosa (¡ah, no has tenido en cuenta la raíz cuadrada de la velocidad del viento!). Pero la solución es bastante simple: 50M de líneas a razón de 2cm por línea hacen 100M de centímetros, es decir, 1M de metros. Y 1M de metros son mil veces mil metros, es decir, mil kilómetros. Incluso una máquina puede dar con la respuesta correcta en nada.

Puede que el cálculo mental sea una disciplina que haya caído en desgracia en los recientes planes de estudio. Pero, aparte de los beneficios que pueda aportar su ejercicio frente a la enfermedad del Alzheimer, nos aparta también del anumerismo.

Hacer pequeñas operaciones matemáticas (eminentemente, divisiones) a la hora de leer el periódico, aunque sólo sean correctas en orden de magnitud, nos ayuda a entender el mundo: ¿a cuánto asciende la deuda griega por europeo? ¿Y el gasto militar por español? ¿A cuánto nos salieron los 8.000 millones del Plan E por barba?

Las calculadoras pueden ser más veloces a la hora de obtener una respuesta exacta. Pero sacarlas del bolsillo, teclear nosecuántos ceros (¡yo siempre los cuento mal!), etc. nos incomoda. Una respuesta aproximada utilizando cálculo mental y cuatro trucos simplificadores está siempre a la mano.

Y nos ayuda a entender mejor el mundo. Y tal vez a saber optar mejor cuando el día 20 de noviembre nos pregunten qué España queremos.

Categories: números Tags: ,