españa

¿Por qué vivimos tantos españoles a tanta altitud?

Perdóneseme haber usado lenguaje causal en el título de esta entrada siendo así que no encontrará el lector indicios sólidos de respuesta en lo que sigue. Y, sobre todo, que no se confunda y me tome por un sociólogo a la violeta o un economista posmo: no, soy matemático. Quiero simplemente hacer constar un pequeño ejercicio de análisis espacial usando los paquetes sf y terra de R motivado, eso sí, por una pregunta que se planteó en cierto foro a raíz de esta captura de la Wikipedia:

Mi mapa provincial favorito

Mi mapa provincial de España favorito es este: O, en una versión más cruda, Cosas sobre él: Forma parte de la colección de mapas que provee el INE para su uso con en infausto PCAxis y puede descargarse de aquí (junto con muchos otros, casi todos convencionales y aburridos, mapas de España, sus regiones, provincias y municipios). Para facilitar su uso y, probablemente, infringiendo normas sobre la propiedad intelectual u otras, lo he colgado también aquí.

Tres pirámides poblacionales con nombre

La primera es esta, a la que muchos conocen como la pirámide de población española de 1992, pero que yo conozco como la pirámide de población de la masificación universitaria: Es posible que a muchos no os suene el concepto pero, ¿véis ese pico en la edad de la chavalería? Corresponde a todos esos a los que dio de repente por ponerse a estudiar ingeniería, derecho o matemáticas de forma que no cabían en las aulas.

Sobre la normalización de las direcciones postales

Lo de las direcciones postales es un caos. Trabajar con ellas, una tortura. Y cualquier proyecto de ciencia de datos que las emplee se convierte en la n-ésima reinvención de la rueda: normalización y tal. Cuando todo debería ser más sencillo. Cada portal en España tiene asociado un número de policía, un identificador numérico único. Independientemente de que quienes lo habiten se refieran a él de formas variopintas, vernaculares y, en definitiva, desnormalizadas y desestandarizadas hasta pedir basta.

Elecciones, mapas... y mi favorito

De entre lo bueno que pudan haber traído las últimas elecciones generales (las españolas de abril de 2019, para quien requiera mayor precisión) puede contarse una pequeña revolución en la cartografía electoral. Debemos agradecérselo al equipo de Kiko Llaneras en El País, que nos han regalado esto. Prueba de que las cosas han cambiado es que ha sido replicado en otros sitios, como este. [Nota: no sé si estoy cometiendo injusticias en el párrafo anterior por omisión o confusión en las prelaciones; si alguien dispone de más o mejor información sobre la intrahistoria de esas publicaciones, que me avise.

No son los picos, son los rangos

Me reencuentro con tiempo después (fuente). Llaman la atención sobremanera los picos. Que no tienen otra razón de ser que un cambio en los rangos del eje horizontal. Ahora la pregunta, de ejercicio: ¿cómo harías para representar esos datos para evitar esos artefactos (asumiendo escala lineal en el eje horizontal)?

De España a Dinamarca en dos pasos

De acuerdo con Eurostat, el IRPF recauda en España aproximadamente el 7.5% del PIB nacional; en Dinamarca, como el 25%. Los tipos impositivos en Dinamarca, son más altos que los españoles, pero tampoco puede decirse que estén desaforadamente por encima. En cualquier caso, ese salto (del 7.5% al 25%), puede descomponerse en dos partes. La primera, efecto de cambiar los tipos impositivos en España (sobre la actual distribución de la renta).

España, Platón, Madrid

En 1871-1872 se publicó la primera edición de las obras completas de Platón traducidas al español. Hubo 500 suscriptores en toda España (que entonces incluía, recuérdese, Cuba, Puerto Rico y quién sabe si algún desafortunado lugar más). Y uno más de Uruguay, que solicitó dos copias. En total, 11 volúmenes de 250-350 páginas de texto no demasiado prieto. La distribución provincial de suscriptores fue: Ciertamente curiosa. Más información (incluida la lista de los suscriptores, tanto institucionales como privados), aquí.

Estructura poblacional de España: 2010-2050

Si se puede hacer para Japón, también se puede hacer para España: El código, library(idbr) library(ggplot2) library(animation) library(ggthemes) idb_api_key("pídela en https://www.census.gov/data/developers/data-sets/international-database.html") male <- idb1('SP', 2010:2050, sex = 'male') male$SEX <- "hombres" male$POP <- -male$POP female <- idb1('SP', 2010:2050, sex = 'female') female$SEX <- "mujeres" spain <- rbind(male, female) saveGIF({ for (i in 2010:2050) { title <- as.character(i) year_data <- spain[spain$time == i, ] g1 <- ggplot(year_data, aes(x = AGE, y = POP, fill = SEX, width = 1)) + coord_fixed() + coord_flip() + annotate('text', x = 98, y = -300000, label = 'Datos: US Census Bureau IDB; idbr R package', size = 3) + geom_bar(data = subset(year_data, SEX == "mujeres"), stat = "identity") + geom_bar(data = subset(year_data, SEX == "hombres"), stat = "identity") + scale_y_continuous(breaks = seq(-300000, 300000, 150000), labels = paste0(as.

ISO 3166-2:ES

El estándar ISO 3166-2:ES, ignorado por todos, establece cómo deberían identificarse provincias y comunidades autónomas en España. Obviamente, ni el INE ni nadie le va a hacer el más minimo caso: seguiremos teniendo que recordar que Zaragoza es la provincia 50, Soria la 42, etc. ¡Qué primitivo, qué contraintiutivo! Pero no ha de perderse la esperanza: si me lees y algún día te vas a ver en la tesitura de crear algún tipo de base de datos de gentes y lugares de España, recuerda que existe un estándar internacional medianamente nemotécnico y al socaire de las veleidades vernacularizantes.

rOpenSpain: ahí tiro el guante

La gente de rOpenSci hace cosas a las que merece la pena atento. Tanto por los objetivos como por medios y las formas. Recomiendo seguir sus últimas publicaciones acerca de la profesionalización del proceso de desarrollo de código. Llevo unos meses jugando con una idea inspirada por rOpenSci: crear un respositorio y un consorcio más o menos formal que desarrolle, mantenga y mejore herramientas (en R) de interés para el procesamiento y análisis de datos ya no científicos sino españoles.

Pues sí, puede fabricarse uno para España

r
Es responde a mi entrada de la semana pasada y se lo debemos a la gentileza de Sergio J. El código, con mínimas modificaciones mías (para automatizar la descarga de los datos) es library(pxR) library(dplyr) library(tidyr) library(ggplot2) #---- Carga y transformacion de datos download.file("http://www.datanalytics.com/uploads/3199.px", "3199.px") pob <- read.px("3199.px", encoding = "latin1") pob <- as.data.frame(pob) pob$Sexo <- NULL pob$Periodo <- as.numeric(as.character(pob$Periodo)) pob <- separate(pob, Provincias, into = c("id_provincia", "provincia"), sep = 3) pob$fecha <- as.

Evolución de la edad media de la población por provincias

Abundo en la entrada de ayer. Lo hago para mostrar En el gráfico anterior se muestra la evolución de la edad media de la población de las provincias españolas como diferencia con respecto a una evolución media calculada como la regresión lineal de todas las edades medias con respecto al año. Es decir, algo así como evolución relativa. Se aprecian claramente los rejuvenecimientos relativos de Guadalajara y, en menor medida, Toledo.