Diagramas de caja, 44 años después

Efectivamente, 44 años después de que Tukey describiese su schematic plot, los diagramas de caja no han calado en el gran público. Dado que dichos diagramas son la representación más simple que se me ocurre de una distribución de probabilidad, me temo que es síntoma de un mal mayor: que no estamos preparados para aceptar que los fenómenos no están perfectamente parametrizados y sino sujetos a errores, oscilaciones, perturbaciones, errores e imprevistos.

Pero al margen de la indiferencia del común, la academia tenido la gentileza de seguir ahondando en la metáfora visual de los diagramas de caja y experimentando, cuando menos, en tres direcciones:

  • La de convertirlos en una representación más fidedigna de la distribución subyacente, es decir, hibridizándolos con los diagramas de densidad.
  • La de incorporar medidas de relevancia inferencial como, por ejemplo, marcas que señalen los intervalos de confianza de los estadísticos (p.e., la media) que representan.
  • Extensiones bidimensionales.

El lector encontrará ejemplos de las tres extensiones aquí y aquí.