Andrew Gelman nos invita a no usar más el test de Wilcoxon.
El test de Wilcoxon reemplaza las observaciones obtenidas por sus rangos y construye un estadístico basado en estos últimos. Eso implica descartar información pero puede ayudar a ganar robustez en situaciones en que los datos se desvíen de la normalidad.
¿Qué sugiere Gelman? Que si realmente estamos dispuestos a descartar información, en lugar de reemplazar las observaciones originales por sus rangos, usemos z-scores —los cuantiles de la normal estándar correspondientes a los cuantiles muestrales—, y usemos la teoría normal (en su doble acepción).
De nuevo, según Gelman, la popularidad del test de Wilcoxon se debe a razones históricas. Es otra consecuencia del hecho de que la estadística se conformase antes de que se popularizasen los ordenadores. Calcular los rangos es una operación mucho más sencilla que obtener cuantiles de la normal estándar si hay que hacerla a mano y consultando tablas en el apéndice de un libro.
Mi comentario: Supongo que algún día habrá que poner orden en el edificio de la estadística e ir enterrando recetas viejunas. Hoy en día se puede operar a partir de principios generales y dejar los detalles a los ordenadores. No es casualidad que esté publicando entradas sobre stan
recientemente: basta con especificar el modelo probabilístico y lanzar una simulación. Sin embargo, soy consciente de que los recetarios son más fáciles de enseñar y sobre todo, examinar. Morirán despaciosísimamente.
Mis profesores en el pregrado no me hablaban bien de la estadística bayesiana porque juraban que el investigador sesgaba con las previas a las posteriores. A mí me gusta verla como una manera más de obtener parámetros. Tú dices que ‘lanzas simulaciones’. ¿Qué opinión tienes sobre esta manera de obtener parámetros?¿Cómo ves a la estadística bayesiana?¿Reflexionas mucho sobre las previas?¿Algún ritual? Pregunto por curiosidad.
Eh… no estoy hablando aquí de nada bayesiano. Solo que, tal vez, en lugar de hipotetizar que la distribución de los datos es normal puedo, por ejemplo, simular esa distribución.
Citar a Gelman, usar stan… jeje. Ya nos darás un post al respecto. ¡Salud!
@freddylopez Para eso Dios inventó las distribuciones a priori no informativas. La estadística bayesiana es más un método de trabajo que una verdad absoluta. Creo que esto también lo dijo Gelman. Si tienes conocimiento previo, lo incorporas. Y si no, pues no.