Tu tasa de paro personal

En el pasado nos hemos ocupado en estas páginas del desempleo. Hoy, día en el que se han anunciado los datos de la EPA del último trimestre de 2012, sale a la luz TTParo.es, un proyecto en el que he colaborado (aunque en el que todo lo que se ve es obra de Kaleidos) y que permite calcular tu tasa de paro personal.

Por ejemplo, en

puedo ver la evolución de la tasa de paro de aquellos que son como yo desde el 2005 y compararla con la general.

Desde hace mucho tiempo vengo repitiendo que la forma en la que se informa de los resultados trimestrales de la EPA tiene un sesgo administrativo (por provincias o comunidades autónomas) con reminiscencias de la sección de deportes (el equipo de mi ciudad es mejor que el de la tuya). Pero provincia, comunidad autónoma y, en cierta medida, el sexo, no son las variables determinantes que nos afectan a la hora de buscar empleo: existen otras más importantes que nos encajan en segmentos relativamente estancos y en los que, en definitiva, nos movemos.

Y la información sobre este fenómeno con una dimensión micro tan humana debería, creo yo, reflejar mejor estas circunstancias.

(Y sí, hemos usando subterráneamente R y el paquete MicroDatosEs).

13 comentarios sobre “Tu tasa de paro personal

  1. José Luis 24 enero, 2013 17:25

    Buenas. Interesante el proyecto. Cómo de subterráneo ha sido el uso del paquete MicroDatosEs . lo digo porque en mi máquina (dual core , debian 64 bits con 4gb de ram) leer más de 7 ficheros de microdatos de la EPA a la vez le cuesta bastante.. jejjej.

  2. datanalytics 24 enero, 2013 17:28

    @José Luis Sólo se usa R en la captura y agregación primera de los datos. Luego se vuelcan en PostgreSQL con algunos precálculos cuyos detalles desconozco.

  3. Luiyo 24 enero, 2013 21:44

    Muchísimas gracias por todo, una grandísima cuota de paternidad de ttparo.es es tuya!

  4. José Luis 26 enero, 2013 14:13

    La muestra es muy pequeña al desagregar por provincia, sexo, edad y nivel de estudios. El efecto se ve en el gráfico del post, por ejemplo. Se podría modelizar de alguna forma y en vez de dar la tasa calculada ofrecer la estimada por el modelo.

  5. José Luis 26 enero, 2013 14:43

    Por ejemplo, para mi perfil :
    nivelest:superior
    edad : de 35 a 39 años
    sexo : Varón
    provincia:Granada

    Sólo hay 19 encuestados en la EPA, 17 activos y sólo 1 en paro. Si tengo en cuenta el factor de elevación da un 4% de paro.

    Me he construido un pequeño glm tomando solo los activos , tomando como variable respuesta si se está en paro o no. Sólo he tenido en cuenta efectos principales de sexo, edad, nivel de estudios y provincia.
    modelo <- glm(formula = aoi ~ nforma3 + edad + sexo + prov, family = binomial,
    data = dat.nuevo)
    El modelo predice para mi perfil una tasa de paro del 19.8%.

    Saludos.

  6. datanalytics 26 enero, 2013 23:02

    @José Luis La verdad es que no tengo claro cómo hacerlo «bien».

    Estás dejando de lado la elevación (que no es intrascendente). Tampoco sé si habría que anidar factores dentro de otros o cruzarlos (¿afecta igual la formación a todos los grupos de edad?). Etc. Tengo la sensación, de todos modos, que las tasas de paro son bastante estancas (que pueden ser «independientes» por nivel de formación, con poca influencia de la provincia, por ejemplo) aunque no puedo ni probarlo ni refutarlo.

    Pero efectivamente, en algunas «casillas» (combinaciones de los cuatro factores) hay demasiados pocos sujetos. Tal vez una estimación de la varianza (tal vez con unos márgenes de error amplios que den una medida de la inexactitud de la tasa estimada) valdría para que no se tomen muy al pie de la letra.

    También es cierto que traté de eliminar la provincia como factor, dado que para muchos no es un factor particularmente importante y les da igual ir a trabajar a otro lado. Eliminarla amplía mucho el tamaño de la muestra.

  7. Olivier 27 enero, 2013 17:44

    He probado el widget.
    Acertado proyecto y bonito diseño.
    Para evitar unas curvas improbables en ciertas provincias,
    me conformaría con la comunidad autónoma.
    Proporcionaría una información más fiable y creo suficiente sobre la geografía del paro.
    Un abrazo. Olivier

  8. datanalytics 27 enero, 2013 17:56

    @Olivier Tienes razón. Muchas de esas objeciones (y algunas más) las planteé en mi día. Digamos que yo era el estadístico detrás del proyecto.

    Pero primó en todo momento la simplicidad sobre otras consideraciones.

    Una manera de plantear el asunto hubiese sido (elevando la complejidad del proyecto) prohibir el descenso a categorías inferiores cuando el tamaño de la muestra correspondiente fuese inferior a un determinado umbral. Así, por ejemplo, en Soria no se podría bajar más allá de sexo, pero en Madrid se podría descender a todas las categorías.

    De todos modos, el proyecto no lo veo tanto como un fin en sí mismo sino, más bien, un ejemplo de que «otra estadísica pública es posible». Una estadística pública que tenga menos fines (aparentes) administrativos y más interés en mostrar a la gente cómo le afectan personalmente las grandes cifras. Por ejemplo, prestando más atención a las variables accionables: aquellas que la gente puede manipular para que un determinado fenómeno (desempleo, inflación, etc.) le afecte menos.

    Por ejemplo, creo que en Inglaterra existe «tu tasa personal de inflación» (al menos, existió). Y hay algunos ejemplos más por el mundo.

  9. José Luis 27 enero, 2013 20:54

    @datanalytics
    Tienes razón Carlos. Sin meterme en interacciones ni factores anidados, pero ponderando por factor de elevación utilizando la función lrm del paquete rms , para el mismo modelo el modelo estima una tasa de paro del 20.7% para mi perfil..

    Y enhorabuena por el proyecto.

  10. datanalytics 27 enero, 2013 21:11

    @José Luis Igual en lugar de utilizar datos de un periodo para un «segmento» podría ser mejor usar la serie histórica para dicho segmento (tal vez corregida). Aunque en un periodo concreto la selección de individuos sea «rara», tal vez el trimestre anterior fuese más normal.

    Me gustaría saber si hay literatura sobre cómo hacer esto «como Dios manda».

  11. Luiyo 27 enero, 2013 21:44

    Estoy siguiendo con atención este diálogo, tanto que redirijo aquí a todos los que me proponen cambios desde el punto de vista estadístico.

    Me pregunto si en España hay datos abiertos para realizar «tu tasa de inflación»…

  12. datanalytics 27 enero, 2013 21:53

    @Luiyo Sí, porque tienes en el INE la variación de precio de todas las categorías de productos. Sólo habría que dejar que cada cual seleccionase su propia cesta de la compra: sacando el tabaco, p.e., si no fuma, etc.

  13. Ender Muab'Dib 15 abril, 2013 10:20

    Es una buena idea. Me encanta como un ejemplo de que “otra estadísica pública es posible”.

    Sobre lo último que proponéis, la OCU tiene algo parecido, aunque sólo te muestra el precio actual y no te permite ver la evolución, pero es útil para saber dónde comprar. Lo malo es que sospecho que los datos estarán desactualizados desde que hicieron el estudio (o no).

    La OCU publicó hace medio año un estudio analizando los precios de diversos productos que te permite saber cuáles son los supermercados más baratos de tu ciudad. Hace falta registrarse en la web, pero es gratis y da una información muy interesante y que os recomiendo mirar. Además de permitir seleccionar tu propia compra, hay tres tipos de cestas predefinidas: primeras marcas, los productos más baratos de cada tipo (marca blanca supongo) y productos frescos.

    http://www.ocu.org/consumo-familia/supermercados/calculadora/ahorrador-cesta-de-la-compra

Los comentarios están desabilitados.