No uses el test de Wilcoxon, nos dice Gelman

Andrew Gelman nos invita a no usar más el test de Wilcoxon.

El test de Wilcoxon reemplaza las observaciones obtenidas por sus rangos y construye un estadístico basado en estos últimos. Eso implica descartar información pero puede ayudar a ganar robustez en situaciones en que los datos se desvíen de la normalidad.

¿Qué sugiere Gelman? Que si realmente estamos dispuestos a descartar información, en lugar de reemplazar las observaciones originales por sus rangos, usemos z-scores —los cuantiles de la normal estándar correspondientes a los cuantiles muestrales—, y usemos la teoría normal (en su doble acepción).

De nuevo, según Gelman, la popularidad del test de Wilcoxon se debe a razones históricas. Es otra consecuencia del hecho de que la estadística se conformase antes de que se popularizasen los ordenadores. Calcular los rangos es una operación mucho más sencilla que obtener cuantiles de la normal estándar si hay que hacerla a mano y consultando tablas en el apéndice de un libro.

Mi comentario: Supongo que algún día habrá que poner orden en el edificio de la estadística e ir enterrando recetas viejunas. Hoy en día se puede operar a partir de principios generales y dejar los detalles a los ordenadores. No es casualidad que esté publicando entradas sobre stan recientemente: basta con especificar el modelo probabilístico y lanzar una simulación. Sin embargo, soy consciente de que los recetarios son más fáciles de enseñar y sobre todo, examinar. Morirán despaciosísimamente.

4 comentarios sobre “No uses el test de Wilcoxon, nos dice Gelman

  1. Freddy López 21 julio, 2015 4:33

    Mis profesores en el pregrado no me hablaban bien de la estadística bayesiana porque juraban que el investigador sesgaba con las previas a las posteriores. A mí me gusta verla como una manera más de obtener parámetros. Tú dices que ‘lanzas simulaciones’. ¿Qué opinión tienes sobre esta manera de obtener parámetros?¿Cómo ves a la estadística bayesiana?¿Reflexionas mucho sobre las previas?¿Algún ritual? Pregunto por curiosidad.

  2. Carlos J. Gil Bellosta 21 julio, 2015 4:44

    Eh… no estoy hablando aquí de nada bayesiano. Solo que, tal vez, en lugar de hipotetizar que la distribución de los datos es normal puedo, por ejemplo, simular esa distribución.

  3. Freddy López 21 julio, 2015 6:13

    Citar a Gelman, usar stan… jeje. Ya nos darás un post al respecto. ¡Salud!

  4. jbm 22 julio, 2015 12:13

    @freddylopez Para eso Dios inventó las distribuciones a priori no informativas. La estadística bayesiana es más un método de trabajo que una verdad absoluta. Creo que esto también lo dijo Gelman. Si tienes conocimiento previo, lo incorporas. Y si no, pues no.

Los comentarios están desabilitados.