¿Se puede predecir con Twitter?

2012-5-14 (Última modificación: 2012-5-14)

Tal y como quedaron establecidos hace 80 años los parámetros para determinar si una hipótesis es o no plausible —por no calificarla de significativa o, más malévolamente, publicable— sólo una de cada veinte lo serían.

Es un hecho que contrasta con la habilidad de los consultores que se dedican a esa labor tan difícil de acotar y que va desde la estadística a la minería de datos tocando otras áreas más o menos afines. Los buenos, siempre encuentran efectos significativísimos y relevantísimos con que adornar sus presentaciones. So pena de ser sustituidos por otros con todavía menos escrúpulos que sepan envolver con maña en pan de oro el accidente y la aleatoriedad.

Análogamente, una miríada de publicaciones sobre Twitter han contribuido a crear una especie de halo casi místico alrededor de dicho servicio de microblogs: dizque permite tomar el pulso a la sociedad hasta el punto de permitir predecir, entre otros, resultados electorales.

Por eso es refrescante leer artículos como I Wanted to Predict Elections with Twitter and all I got was this Lousy Paper de Daniel Gayo Abello, que ofrece una crítica razonada de la, por así llamarla, literatura optimista.

En resumen:

No todo el mundo está en Twitter, por lo que las conclusiones que se obtengan a partir de él tienen un sesgo geográfico y demográfico. La gente, de hecho, lleva décadas escribiendo libros sobre muestreo por algún motivo.
Ni siquiera todo el mundo escribe sobre política (relevante a la hora de predecir elecciones) en su cuenta de Twitter.
No todo lo que aparece en Twitter es verdad: hay contenido generado por robots, cuentas falsas, etc. que puede sesgar los estudios.
Desentrañar el significado de un mensaje no es sencillo para una máquina cuando este está envuelto en sarcasmo, encierra juegos de palabras, etc.