Medias de medias… ¿a estas alturas de siglo?

Lo sospechaba y ha resultado ser cierto: media de medias. ¡Carajo! El siguiente gráfico que compara la tasa media de paro entre el norte y el sur de España está extraído de El Economista:

¿Cómo se han calculado los porcentajes? Veámoslo (a partir de los datos que aparecen en el artículo); para el sur, promedia las tasas de paro de cada comunidad autónoma así:

> mean( c( 30.93, 29.55, 22.44, 24.73, 23.6, 24.19, 33.2, 23.81 ) )
[1] 26.55625

Operación que, obvia decirlo, sólo sería correcta si la población de todas las comunidades autónomas implicadas fuese, cuando menos, similar (y, p.e., la población de Andalucía fuese comparable a la de Melilla).

Y para el norte, asá:

> mean( c( 16.16, 17.17, 17.81, 14.10, 16.08, 19.43, 17.25, 17.01,
> 11.68, 12.17, 17.39 ) )
[1] 16.02273

Para que no se me ocuse de perpetuo protestador, quiero anunciar que estoy trabajando en un programa (y tal vez paquete) de R que permita importar automáticamente los microdatos de la EPA para que el desmedido talento de los usuarios de R permita desenterrar patrones más interesantes que los que nos regalan mensualmente los periodistas anuméricos.

5 comentarios sobre “Medias de medias… ¿a estas alturas de siglo?

  1. Juanjo 3 noviembre, 2011 8:42

    ¡Con lo fácil que es calcular la media ponderada! (en este caso empleando como ponderación la población activa de cada CC.AA.).

  2. jaume 3 noviembre, 2011 11:22

    Hola,
    Digo yo en mi ignorancia ¿Al ser porcentajes no es como una especie de valores ponderados? Al fin y al cabo están calculados sobre la población activa.

    jaume

  3. Sergio 3 noviembre, 2011 11:52

    @jaume

    Jaume, piensa en cómo cambiarían esos valores si dividiesen Melilla en 10 comunidades autónomas.

  4. jaume 7 noviembre, 2011 13:03

    OK, ya lo veo.
    Si dividimos Melilla en 10 C.A. tenemos 10 C.A. de poquísimos habitantes que valen lo mismo que por ejemplo Madrid que está muy habitada.

Los comentarios están desabilitados.