Infradispersión de conteos: ¿buenos ejemplos?

La distribución de Poisson se utiliza de oficio cuando se quiere modelar datos relativos a conteos. Sin embargo, tiene un problema serio: la varianza está fijada a la media: ambas son \lambda, el parámetro de la distribución.

Muy frecuentemente se observan datos con sobredispersión. Si \lambda es 1000, el número esperado de eventos está contenido en un intervalo demasiado estrecho,

qpois(c(0.025, 0.975), 1000)
#[1]  938 1062

como para ser realista en muchas aplicaciones.

En otras situaciones más raras, se observa el fenómeno contrario, la infradispersión. Hay un ejemplo de libro que ocurre cuando se imponen cuotas. Por ejemplo, el número de multas que se ponen en un departamento de policía puede quedarse muy cerca del nivel del objetivo de productividad cuando se impone uno.

El otro día se me ocurrió otro: el número de duchas diarias. Si tiene, p.e., media de 1, la distribución tiene una pinta, de nuevo, poco realista:

table(rpois(1000, 1))
#  0   1   2   3   4   5   6   7 
#371 365 184  60  16   1   2   1 

No sé si alguien quiere participar su ejemplo de infradispersión favorito. Tiene los comentarios a su entera disposición.

5 comentarios sobre “Infradispersión de conteos: ¿buenos ejemplos?

  1. ajsaezUJA 1 febrero, 2017 23:21

    Tengo uno clásico para diferenciar sobredispersión e infradispersión asociados a contagio: si ves a un ciervo, es probable que veas más ciervos cerca; si ves un zorro, es poco probable que veas otro zorro cerca.

  2. Guillermo Luijk 2 febrero, 2017 0:04

    Un ejemplo de distribución de Poisson se tiene en el conteo de fotones convertidos en carga en cada fotodetector en una cámara digital:

    – Para exposiciones bajas (escena con poca luz) se convierten muy pocos fotones (aunque suene a ciencia ficción, puede estimarse su número) y hablaríamos de lambdas muy bajas, sobredispersión. Así la relación S/N, que es lo que importa en fotografía, si solo hubiera ese ruido poissoniano (fotónico) sería baja. En el mundo real la relación S/N con baja exposición es todavía peor, porque al fotónico se suma el ruido electrónico (gaussiano) que en realidad es el dominante para esos niveles de exposición. Ésta es la explicación de porqué hacer fotos con un móvil de noche es un ejercicio de gran optimismo.

    – Para exposiciones altas (luz a raudales), el ruido electrónico, que es constante, deja de ser dominante y predomina el ruido fotónico (poisson), que ante una tasa de llegadas grande (muchos fotones convertidos) se torna gaussiano. De nuevo como lo que importa es la relación S/N, aunque el ruido fotónico aumenta según la raiz de la señal, el cociente S/N aumenta también según la raíz de la señal. El resultado práctico es que el ruido fotónico, pese a estar siempre ahí por ser inherente a la naturaleza discreta de la luz, no le quita el sueño al fotógrafo.

    En la Fig. 3 puede verse para cada canal RGB la distribución de Poisson («gaussinizada») de una captura fotográfica real. En la Fig. 2 el ruido electrónico (se ha aislado del fotónico tapando el objetivo = 0 fotones).

    http://www.guillermoluijk.com/article/rawnoise/index.htm

    Salu2!

  3. jbm 2 febrero, 2017 9:09

    El uso del débito conyugal parece venir a la mano: 1 a la semana. Y también está fijado el día: sábado.

  4. Jose Luis Hidalgo 24 febrero, 2017 20:42

    Pues a mi esto me suena un poco a «un problema con la ley de la gravedad a que tiene a generar fuerzas muy intensas para grandes masas y muy livianas para masas microscópicas». No. La ley es la gravedad es la que es y está bien, la distribución de Poisson da la resultados que da, y están bien, en tanto en cuanto se aplique correctamente. Y «correctamente» no incluye, ni mucho menos, cualquier «dato relativo a conteo», porque para empezar las ocurrencias tienen que ser independientes, cosa que no pasa ni para las multas ni para las duchas diarias. La culpa no es Poisson, no hay sobredispersión ni sobredispersión, es de un modelado de datos incorrecto. Lo que habría que preguntarse, tal vez, es como de robusto es un modelo de Poisson respecto al no cumplimiento de las hipótesis (y la respuesta es: mucho menos que los modelos gaussianos, y precisamente por eso muchos los utilizan descuidadamente, porque están mal acostumbrados). Por cierto, incluso cuando la aplicación de un modelo de Poisson es correcta, la aparente sobredispersión de los datos tiene que ver, muchas veces, con la dispersión del propio parámetro lambda entre la población de posibles eventos, pero es es la historia…

Los comentarios están desabilitados.