He actualizado el repositorio que anuncié aquí, es decir, este, con una función adicional cuya razón de ser es la siguiente:
- El ministerio de la cosa hace una encuesta sobre hábitos de compra y consumo de alimentos en España.
- Luego proporciona dos vistas sobre los mismos datos:
- Una, en forma de ficheros
.xls
con más profundidad histórica, datos más recientes y menos variables. - Otra, a través de un formulario web que devuelve páginas con tablas
html
que tiene menos profundidad histórica, tiene un retraso mayor de publicación pero alguna variable más (p.e., la penetración).
- Una, en forma de ficheros
No preguntéis por qué. El bienestar de todos, que es la aspiración máxima de las instituciones públicas, se escribe derecho pero con renglones torcidos.
Nota: Correr el script que baja datos de los formularios lleva unas cuantas horas.
Otra nota: Igual alguien quiere correr periódicamente esos scripts para generar y volcar datos en alguno de esas plataformas desde la que agentes privados proveen servicios públicos de primera (p.e., GitHub).