Gráficos de embudo para controlar la varianza en muestras pequeñas
Publiqué hace un tiempo una entrada en esta bitácora sobre el problema que representa la desigualdad de los tamaños muestrales a la hora de comprender cierto tipo de datos, como por ejemplo, los que trata de representar el gráfico
que muestra la incidencia del cáncer de riñón en distintas zonas de en EE.UU. Como indiqué entonces, los valores extremos se encuentran en zonas menos pobladas: cuanto menor es la población, más probables son las proporciones inhabituales.
Los gráficos de embudo son una alternativa pensada para evitar este tipo de sesgos. Por ejemplo
relaciona la proporción de casos de cáncer con el tamaño de la población añadiendo, si se me permite el término, curvas de isosignificancia para facilitar la comparación entre entidades desiguales en tamaño.
El que quiera saber más al respecto, tiene un artículo de Spiegelhalter sobre gráficos de embudo. Además, existe la posibilidad de crearlos, cuando menos, con
- una herramienta en línea,
- R e,
- incluso, en SAS (usando SAS/IML).