¿... coma cero dos por ciento? ¡Anda ya!

Hoy hablo en la reunión del grupo de usuarios de R de Madrid. Voy a reciclar la charla que di en las IV Jornadas de Usuarios de R sobre mi paquete MicroDatosEs y voy a aprovechar para criticar, en mi estilo, enunciados como

El número de parados crece en 85.000 personas y alcanza la cifra de 5.778.100. La tasa de paro se incrementa 38 centésimas hasta el 25,02%.

que pueden encontrarse en la nota de prensa del INE que resume los resultados de la última encuesta de población activa, la del tercer trimestre de 2012.

En efecto, aprovechando que el paquete MicroDatosEs permite cargar fácilmente los microdatos de la EPA, voy a construir gráficos como

en el que se muestra en qué rangos podría estar variando la tasa de paro recogida por el INE si el azar hubiese hecho que los entrevistados fuesen otros que los unos que eligió finalmente el INE en 1000 universos paralelos idénticos al nuestro salvo por ese pequeño detalle. Los resultados no son escandalosamente distintos de los que con cuatro cifras significativas reificaron los medios pero pone en cuestión nuestra manía por la ultraprecisión.

Y luego, refinando la tortura, nos haremos la misma pregunta a niveles inferiores al nacional para ver si se cumple o no que la varianza decrece con la raíz cuadrada de n y qué pueden significar los números publicados aplicados a Soria, La Rioja o Melilla.

¿Nos veremos?