Un año, el 2016, mueren 1160 personas en accidentes de tráfico. El anterior, 1131, i.e., 29 menos. Ruido estadístico aparte, ¿aumentan?
Comenzamos a optar. Primera elección subjetiva: son muestras de una Poisson de parámetro desconocido. La pregunta: ¿el mismo?
Una manera de estudiar lo anterior es plantear
1160 ~ poisson(lambda * (1 + incr)) 1131 ~ poisson(lambda)
y estudiar la distribución de incr
. Que a saber qué distribución tendrá (teóricamente). Pero, ¿importa?
Mejor que rebuscar a ver qué distribución podría tener la cosa, basta con envolverlo en un poco de seudo-C++,
stancode <- '
parameters{
real lambda;
real incr;
}
model{
1160 ~ poisson(lambda * (1 + incr));
1131 ~ poisson(lambda);
}
'
y luego, dejar que la magia surta efecto:
library(rstan)
fit <- stan(model_code = stancode, chains = 1,
iter = 12000, warmup = 2000, thin = 10)
summary(fit)$summary[1:2, c("mean", "2.5%", "97.5%")]
# mean 2.5% 97.5%
#lambda 1.131041e+03 1065.3705780 1200.341736
#incr 2.745496e-02 -0.0531976 0.116086
Y se podrían pintar los histogramas, etc. También podemos de alguna manera estimar la probabilidad de que la accidentalidad haya subido, si es que la pregunta tiene sentido:
tmp <- as.data.frame(fit)
mean(tmp$incr > 0)
#[1] 0.732
Es decir, podíamos decir que hay un 25% de probabilidades de que los neocríticos de la DGT estén equivocados.
Siempre que veo esas estadísticas y en relación con la «accidentalidad» que comentas, si dicho concepto tuviera sentido traducirlo como número de accidentes entre el número total de vehículos en circulación (o algún proxy que permita comparar año tras año) a lo mejor, si tras una crisis (aunque no creo que esté muy atrás, más bien una mejora económica, pero eso es otro tema …), hay más gente que coge el coche y/o lo usa más, a lo mejor no es tanto como parece, pero bueno, eso lo dejo para que lo piense el periodista que da la noticia y la institución en sí. Me acuerdo de otra noticia que se daba que decía algo así como «En 4 de cada 10 muertes por accidentes de tráfico no se llevaba el cinturón de seguridad», ¿Quiere decir esto que es mejor no ponérselo? Porque desde luego si no te lo pones, la probabilidad de palmarla es de 6 de cada 10 (que dado como estuvo dicho supongo que es lo que cualquiera puede llegar a entender)
Carlos, mete al modelo la variable consumo de carburantes (http://www.cores.es/es/estadisticas) verás que sorpresa.
@rvaquerizo: Hummm… ¿bajó el consumo de gasolinas y gasóleos en 2016 con respecto a 2015? ¿Es eso lo que me quieres decir?
@Francisco: Muy buen punto lo de la probabilidad. Hay muchos casos de esos por ahí. Creo que van a entrar intravenosos a unas cosas que estoy escribiendo en otra parte…
Carlos, en realidad los datos no están actualizados a diciembre de 2016. Si te centras sólo en los datos hasta noviembre y sumas gasóleos y gasolinas el incremento ha sido de un 1,8% en la línea del incremento de fallecidos.
@rvaquerizo: tienes razón, ¡se me había pasado!
Necesito recuperar esa clase pérdida de Stan..
@jrcajide ¿y un curso sobre programación probabilística, bayes y demás hierbas? El otro día en la reunión de Erreros aluciné bastante con el tema.