Voy a partir una lanza a favor de Rosell a cuenta de la EPA

2013-2-11 (Última modificación: 2013-2-11)

Voy a partir una lanza a favor de Rosell. Aunque algún colega luego me quiera fusilar. Espero que lo podamos discutir todo luego amigablemente sea acá o en otros foros igualmente civilizados.

Las encuestas tienen algo de mágico. Parecen una versión revivida de los antiguos oráculos. No deja de sorprender que sea posible conocer la opinión de millones de personas preguntando a un par de miles de ellas, ¿verdad?

Además, los resultados de muchas encuestas se agotan en sí mismos: qué porcentaje de la gente opina esto o lo otro. Y no tienen mayor trascendencia. Ni existe un patrón contra el que medir en qué medida yerran. A lo más, una escueta ficha técnica ex-ante.

Pero existe un tipo muy notable de encuestas (a las que ya me he referido previamente) que se contrastan a los pocos días con datos reales: las electorales. Y no hace falta que abunde aquí sobre su éxito o falta de éxito predictivo. Ya se han ocupado otros del asunto, como por ejemplo aquí o aquí. (Tengo la impresión de que los profesionales de la cosa pasan dos de los años del ciclo electoral explicando por qué son tan guays y los otros dos protestando los motivos de fuerza mayor que les impidieron cumplir las expectativas que habían generado).

Claro: una cosa es decir a quién piensa uno votar y otra, votar. Son hechos distintos, obviamente, en cuya fundamental diferencia, quienes realizan los sondeos, no dejan de hacer hincapié siempre después de conocidos los recuentos oficiales.

Pero, qué pasa cuando la pregunta es ¿a quién votó Vd. en las elecciones pasadas? Aquí ya no deberían (¿o sí?) influir ese tipo de circunstancias (incluso meteorológicas) diferenciadoras. Véamoslo.

En el barómetro de enero de 2013 del CIS se tabulan las respuestas de 2483 personas (elegidas con criterio riguroso para que reflejen la realidad de la sociedad española) a ciertas preguntas. Y la tabulación se realiza de acuerdo con su recuerdo de voto en las últimas elecciones generales, las de 2011. Este recuerdo de voto debería ser mínimamente coincidente con los resultados reales en dichas elecciones, ¿verdad? Véamoslo. Haciendo en R

options(digits = 2)

library(xtable)

cis <- c(663, 545, 153, 79, 50, 154)
reales <- c(10830693, 6973880, 1680810, 1140242, 1014263, 2299688)
names(reales) <- names(cis) <- c("PP", "PSOE", "IU",  "UPyD", "CiU", "Otros")

tmp <- data.frame( cis = 100 * cis / sum(cis), reales = 100 * reales / sum(reales))
tmp$diff <- tmp$cis - tmp$reales
tmp$diff.pc <- 100 * tmp$diff / tmp$reales

print(xtable(tmp), type = "html")

se obtiene

cis	reales	diff	diff (%)
PP	40.33	45.24	-4.91
PSOE	33.15	29.13	4.02
IU	9.31	7.02	2.29
UPyD	4.81	4.76	0.04
CiU	3.04	4.24	-1.20
Otros	9.37	9.61	-0.24

donde la primera columna corresponde a los porcentajes de votos obtenidos en la encuesta del CIS, la segunda a los reales (descontados en ambos casos los nulos y blancos) y las demás son las diferencias. Cierto, quedan sin computar los 55 sujetos que no recuerdan su voto y los 196 que se negaron a contestar esa pregunta. Pero a ti, lector, ¿te parece que las discrepancias están dentro de rango?

Ahora, el tema Rosell. Viene el tal señor y critica la EPA. Dizque no es fiable. Que es una encuesta. Que no se cree los números que arroja. Que si en España no hay seis millones de parados. Etc.

Y se le responde en masse con esto, esto o esto. Salvo en algunos casos, como este, la defensa de la EPA se realiza ad verecundiam.

Rosell, que es empresario, tiene que y debe ser y actuar como Tony el Gordo, el personaje de El Cisne Negro de Taleb. Y como su alter ego de la ficción, hace bien en cuestionarse números que se le dan hasta la cuarta cifra significativa como palabra de la OCDE, la UE y la OIT si no de Dios directamente.

Y es tarea del INE, de quienes se sientan irritados por esta entrada e incluso de mí mismo explicar qué se puede y qué no se puede esperar de una encuesta, sus méritos y sus deméritos, sin caer en la falacia de la reificación.