Contraargumentando (materialmente) sobre la falacia del fiscal

Hace un par de días hablé de la falacia del fiscal y granos de arroz. La entrada iba acompañada de

y la lección era: es raro no encontrar ningún clúster cuando se tiran al azar granos de arroz sobre una superficie. De lo que se derivaban más cosas que es ocioso repetir aquí.

Pero el gráfico no es desconocido para los viejos del lugar: se parece mucho al de la página 319 de ESL. Para los que no lo tengáis a mano, la parte donde se habla de un algoritmo que se llama igual que un general de Reus con calle en Méjico DF: PRIM.

PRIM y otros algoritmos similares buscan precisamente eso: lugares en un (no necesariamente el) espacio donde las observaciones tienden a aglomerarse. PRIM está implementado en R. También está disponible otro paquete, rsubgroup, que remite a esta página llena de documentación.

En la que seguro que no se habla de la falacia del fiscal. Porque una cosa es detectar aglomeraciones y otra muy distinta que estas sean del interés de la Guardia Civil.

Addenda: En estas páginas hay algo de información friqui relevante para la discusión anterior.