La EPA, en Materia (y otros medios)

Ha salido publicado recientemente un artículo en Materia sobre la EPA. Abunda sobre los temas que traté en una charla anterior. Y agradezco a su autor, Daniel Mediavilla tanto el haberse interesado por el asunto como el mencionarme en el artículo.

El artículo ha sido reproducido en otros medios, como elDiario.es y El Economista.

Puede que el titular (¡ah!, esa manía de los periodistas por el titular) invite a interpretaciones que poco tienen que ver con el contenido y la intención del texto. Es curioso, en ese sentido, leer los comentarios de los lectores de los tres medios en que ha aparecido la noticia. De los que extraigo la siguiente conclusión: ¡qué dura va a ser la campaña contra el anumerismo!

5 comentarios sobre “La EPA, en Materia (y otros medios)

  1. Isidro 16 julio, 2013 13:40

    He visto el video de tu charla y me ha parecido muy interesante en un aspecto que paso a comentar…
    Es evidente que desde un punto de vista estadístico, la tasa de paro que nos da la EPA (por concretar en uno de los parámetros) tiene un nivel de confianza determinado, por lo que es un exceso utilizar dos cifras decimales. Totalmente de acuerdo.
    Pero pienso que en la práctica hay que valorar lo que es la señal y el ruido en la serie de cada estadístico, trimestre a trimestre, para decidir si debemos preocuparnos o no por ese «exceso de precisión». Si hacemos una gráfica con la tasa de paro de España, de Castilla-La Mancha (Comunidad Autónoma de tamaño medio) y de la Rioja (pequeña), vemos claramente que a escala nacional nos importa muy poco el ruido, porque las señales de ciclo-tendencia y de estacionalidad están muy por encima del primero. Por lo tanto, a escala nacional, no veo importante preocuparse por si el INE da 2 cifras decimales en la tasa de paro. Lo mismo pasa para una Comunidad Autónoma media, como Castilla-La Mancha, con unos 2 millones de habitantes.
    Vuelvo a darte la razón cuando analizamos la serie de una Comunidad Autónoma pequeña. El ruido es tan grande que es muy poca información la que podemos sacar de la EPA, por lo que utilizar dos decimales en este caso… no vale para nada. Incluso inducimos a engaño utilizándolos, dando una precisión que es absolutamente irreal. Esto viene a confirmar lo que ya sabíamos: la EPA es una encuesta muy buena, pero en cuanto las poblaciones elevadas se hacen medianamente pequeñas lo mejor que podemos extraer es una tendencia a medio plazo, ni siquiera podemos confiar en las variaciones trimestre a trimestre.
    P.D.: leídos los comentarios en las páginas que mencionan tu artículo, no sé si reír (no he podido evitarlo cuando te han llamado Sr. Bellota, como el jamón), llorar, o salir corriendo de este país… en fin, será mejor quedarse y tomárselo con humor…

  2. samuel 16 julio, 2013 14:03

    curioso, pero no entiendo el peso del «rumano»
    si por ejemplo hay una población de 45millones y se hacen 200mil encuestas, entiendo que cada elemento de la muestra representa a 225 personas de la población, pero no entiendo que un elemento pese más que otro

    ¿alguien puede sacarme de mi anumerismo?

  3. Isidro 17 julio, 2013 8:23

    Simplemente que cada persona tiene un poder diferente de representación (factor de elevación) según la sección censal donde vive. Así, hay gente que representa a 28,01 habitantes y otros a 4.366,64 (mínimo y máximo respectivamente en el último trimestre)

  4. datanalytics 17 julio, 2013 12:45

    @samuel Si se me permite abundar en la respuesta de Isidro, añadiré lo siguiente.

    Eres el INE y seleccionas a unos individuos para entrevistar. Lo del método es lo de menos (es sofisticado, está bien hecho pero, como todo, no es perfecto). Comparas la distribución de la población muestreada con la conocida (del padrón, el censo, etc.) en términos de sexo, grupos de edad, nacionalidad, etc. Y ves que son distintos.

    Entonces tienes que repoderar.

    Imagina (caso hipotético) que has entrevistado proporcionalmente a más mujeres de las que corresponderían según el padrón. Eso significa que tienes que dar menos peso a las mujeres entrevistadas. Etc.

    Imagina que en tus entrevistas tienes un 1% de extranjeros pero sabes que estos son el 10% de la población. Entonces tienes que darles diez veces más peso.

    En principio, las técnicas de muestreo deberían garantizar que la población muestreada se pareciese mucho a la subyacente y los pesos fuesen no particularmente desiguales (con salvedades: en Madrid haría falta entrevistar a menos gente que en Soria, por lo que los pesos de Madrid serían mayores que en Soria). En la práctica, pasan _cosas_. De ahí lo del peso _aberrante_ de 4300 que menciona Isidro.

Los comentarios están desabilitados.