Los extraños números de los muertos en carretera por accidente

Escribo esta entrada con cierta prevención porque soy consciente de que dan pábulo a determinadas teorías conspiranoicas de las que soy declarado enemigo. Pero es que los números de muertos en carretera por accidente en España en los últimos años,

(extraídos de aquí) dan que pensar: la varianza de las observaciones correspondientes a los años 2013, 2014 y 2015 es muy baja, demasiado baja. Al menos, si se da como bueno un modelo de Poisson para modelar esos conteos.

De hecho, ejecutando

se ve cómo apenas en 1 de cada 1000 tiradas aleatorias de tres variables aleatorias independientes de Poisson con parámetro ~1132 se obtienen varianzas tan bajas. Y ejecutando

se comprueba que en tiradas de 57 variables aleatorias de Poisson, la varianza mínima de tríos de observaciones consecutivas es menor que la de la serie observada en apenas un 7% de los casos.

Los números son raros, la verdad. En pro del argumento conspiranoico está el razonamiento habitual que justifica en muchas ocasiones la infradispersión de las observaciones: la existencia de cuotas o cupos, sea estos cuales sean, que tienden a fijar los conteos alrededor de una cifra objetivo determinada. En contra, la falacia del fiscal.

Pero es curioso y no está de más dejarlo escrito en algún lado.

4 comentarios sobre “Los extraños números de los muertos en carretera por accidente

  1. Murray Gellman 28 mayo, 2018 11:06

    Estoy de acuerdo con la peculiaridad de la baja varianza de los contajes en los últimos años, pero no con la validez del modelo de poisson en este problema teniendo en cuenta principalmente dospuntos:

    1 – Los accidentes no suceden de manera uniforme sobre las carreteras sino en determinados “puntos de concentración de accidentes”.
    2 – En un mismo accidente pueden morir muchas personas (un accidente desastroso de un autobús supondría un 5% del total de muertes en esos años).

    Aunque esto solo da más pie a considerar la teoría conspiratoria. Un saludo.

  2. Carlos J. Gil Bellosta 28 mayo, 2018 15:48

    Sí, tienes razón. Y no la tienes, las dos cosas a la vez. Digamos que en primera aproximación, se puede plantear un modelo de Poisson para este caso concreto. Al menos, de entre todas las distribuciones de libro, es la más razonable. Luego llegan las consideraciones de segundo orden: por qué no lo es exactamente. Efectivamente, si quisiésemos hilar más fino, podría pensarse en una mixtura de Poissones (una para los accidentes en los que muere una persona, otra para los accidentes en los que mueren dos, etc.). Pero estoy seguro de que las cosas no cambiarían drásticamente. Además, realmente, habría que plantear un modelo teniendo en cuenta el número de kilómetros recorridos (o un proxy suyo), etc. Que bien podría ser una regresión de Poisson (un GLM). Ten en cuenta que esas cosas se hacen sin mayores disquisiciones acerca de la bondad del ajuste (salvo, tal vez, algún apaño en caso de observarse una sobredispersión, lo contrario de lo que ocurre en estos datos, manifiesta).

  3. Asier 10 junio, 2018 12:37

    Dado que esos datos son agregados de procesos que tienen lugar en un espacio geográfico y condiciones muy variables, no entiendo muy bien que podamos modelizar tan sencillamente el agregado total. No obstante, está claro que es curioso cuanto menos que coincidan 3 de 4 cifras significativas. No obstante, parece que concuerda un poco con la evolución general de la gráfica, no? Es un comportamiento con poca aleatoriedad y mucha inercia, como si hubiera variables “tirando” de los datos durante plazos largos de tiempo, lo cual contrasta con una percepción intuitiva de que hay muchas variables que afectan en que haya o no accidentes (al menos eso pienso yo de primeras) y que converjan a valores tan estables, con una gráfica tan continua.

  4. Carlos J. Gil Bellosta 10 junio, 2018 15:18

    Dos cosas. Primero, el hecho de agregar y poder modelizar agregados es justo de lo que trata la estadística, de por dónde van los tiros de la ley de los grandes números, etc. Y hay industrias enteras construidas sobre esos principios: p.e., la de los seguros de vida.

    Y sí, hay tendencias seculares (¿para qué, si no, sirve la DGT?). Pero, a la vez, lo aleatorio es menos aleatorio de lo que indicarían los modelos. Eso es lo raro y lo que motiva la entrada. Compáralas, p.e., con las cifras del suicidio en España, que sí que tienen una varianza mucho más conforme a lo esperado.

Los comentarios están desabilitados.