Fallecimientos y microdatos

Hace un tiempo, un amigo me dijo que si en verano tiende a crecer la tasa de fallecimientos. Como de eso no sé y no hay manera de preguntarle a Google cuándo se muere más la gente, acudí a quienes se encargan de recopilar ese tipo de datos. Y construí en relativamente poco rato un gráfico parecido a

que echaba por tierra su hipótesis.

Ahora quiero retomar el asunto aprovechando que he anunciado el paquete MicroDatosEs para indicar cómo se pueden crear los tres ficheros de metadatos necesarios para leer ficheros de microdatos. En concreto, ese tipo de ficheros de microdatos posicionales a los que tan aficionados son los institutos estadísticos españoles.

El primero tiene cinco columnas (separadas por tabuladores):

  • var, el nombre de la variable
  • start, la posición en la que comienza el dato
  • end, la posición en la que termina
  • width, la anchura, que podría deducirse de los dos valores previos
  • descr, la descripción de la variable

El segundo es otro fichero de texto con cinco columnas también separadas por tabuladores:

  • var, el nombre de la variable, que tiene que coincidir con el del fichero anterior, por supuesto
  • tipo, el tipo de variable
  • nulo, que no me acuerdo para qué lo creé y posiblemente no sirva para nada
  • llave, el código que asigna el INE (p.e., «01»)
  • valor, el valor que corresponde al código (p.e., «mujer»)

Los campos de tipo «N», numérico, no tienen ni llave ni valor. Los campos con llave y valor son de tipo «D», de diccionario. Es probable que haya más tipos contemplados y que hagan falta otros más en función del caso. Pero no me acuerdo bien de los detalles.

Finalmente, el tercer fichero de metadatos no se usa realmente. Sirve para indicar qué valores corresponden a nulos en cada una de las columnas del fichero de metadatos y tiene sintaxis SPSS, cosa que aún no me queda claro qué es. Tengo que ponerme con ello todavía.

Una vez que construyes tus ficheros de metadatos puedes probarlos con la función test.metadata (véase también ?test.metadata) para verificar que funcionan adecuadamente.

Y una vez que funcionan, si eres yo, los puedes integrar en el paquete creando una función tal como defun2011 y su correspondiente fichero de ayuda. Si no eres yo, puedes ponerte en contacto conmigo, enviarme los ficheros de microdatos y los integraría en el paquete con mucho gusto y respetando atribucionalmente tu autoría.

En tanto, ¿algún lector se anima a partir el gráfico que he mostrado más arriba por grupos de edad?

8 comentarios sobre “Fallecimientos y microdatos

  1. Emilio 16 agosto, 2012 14:40

    En los meses de invierno, la mayor mortandad se da entre la población de más edad (la gripe es realmente mortal para los más viejos). Para sacar ese dato, no he hecho el gráfico por edad. Me ha sido más cómodo (no nos mandes tareas, que ¡estamos de vacaciones! 🙂 preguntarle al cura de mi parroquia, que es quien oficia todos los funerales. ¡Feliz Verano!

  2. Paco 22 agosto, 2012 13:20

    Recuerdo haber hecho algún análisis cuando la ola de calor y el resultado era que, efectivamente, nosotros no estamos preparados para el frío y en el resto de Europa no lo están para el calor.

  3. datanalytics 22 agosto, 2012 13:28

    @Paco Hombre, mi «estudio» es muy crudo. Cuando menos, tendría que haber considerado tramos de edad (que el INE hace públicos) y causas de muerte (que no son públicos). Igual así se veían cosas más interesantes…

  4. Paco 22 agosto, 2012 13:49

    Yo incluí edad y otros factores. Me llamó la atención la sobremortalidad que teníamos en invierno y aluciné cuando vi que en países más fríos no ocurría.

  5. Paco 22 agosto, 2012 14:43

    Fue hace años. He cambiado de trabajo demasiadas veces para conservar algo.

  6. José Luis Cañadas 21 noviembre, 2012 22:01

    Hola Carlos.
    Una vez que he creado los tres archivos de metadatos, ¿cómo puedo ejecutar test.metada?. Lo digo porque me pide el nombre de los microdatos en test.metadata(file,md.1, md.2, md.3, encoding = «utf8» ) y sólo tengo los md.1 etc..

Los comentarios están desabilitados.