4.1 El test de Student

El test de Student es la contraparte estadística al diagrama de cajas. Si estos permiten comparar gráficamente, i.e. cualitativamente, dos (o más) distribuciones, el test de Student permite cuantificar de alguna manera esa diferencia.

Para ilustrar el uso del test de Student vamos a analizar el conjunto de datos sleep:

summary(sleep)
##      extra        group        ID   
##  Min.   :-1.600   1:10   1      :2  
##  1st Qu.:-0.025   2:10   2      :2  
##  Median : 0.950          3      :2  
##  Mean   : 1.540          4      :2  
##  3rd Qu.: 3.400          5      :2  
##  Max.   : 5.500          6      :2  
##                          (Other):8

sleep contiene información sobre el número adicional de horas que durmieron una serie de sujetos después de recibir un determinado tratamiento médico. Los vamos a comparar con otros sujetos, los del grupo de control, que recibieron un placebo. El siguiente diagrama de cajas muestra la distribución del número de horas de sueño con y sin tratamiento.

boxplot(sleep$extra ~ sleep$group, col = "gray",
        main = "Diferencias por grupo")

Este gráfico muestra cómo el grupo tratado, el de la derecha, tiende a dormir más horas. Pero no responde fehacientemente a la pregunta de si el tratamiento funciona o no. El llamado test de Student ayuda a determinar si la diferencia observada es o no estadísticamente significativa. Nótese cómo su sintaxis es esencialmente la misma que la de boxplot:

t.test(sleep$extra ~ sleep$group)
## 
##  Welch Two Sample t-test
## 
## data:  sleep$extra by sleep$group
## t = -1.8608, df = 17.776, p-value = 0.07939
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -3.3654832  0.2054832
## sample estimates:
## mean in group 1 mean in group 2 
##            0.75            2.33

La salida de la expresión anterior es la que normalmente reproducen los artículos científicos cuando se aplica esta técnica. El indicador más importante (aunque cada vez más cuestionado) es el llamado p-valor y una regla de decisión habitual es dar por estadísticamnete significativo el efecto del tratamiento cuando este es inferior a 0.05. En este caso, el p-valor es de 0.07 por lo que se consideraría que no existe diferencia significativa entre los grupos.

El test de Student no se puede aplicar a cualquier tipo de datos. Estos tienen que cumplir una serie de condiciones. Cuando las pruebas previas parecen indicar que no dichas condiciones no se cumplen, los manuales recomiendan utilizar una alternativa no paramétrica, la del Wilcoxon. Aplícasela a estos datos comprueba el p-valor obtenido. Nota: en R, es el wilcox.test.

Existen muchas más pruebas estadísticas en R. Que la sintaxis de las dos anteriores (la de t.test y de wilcox.test) sea similar no es casualidad: la de todas las funciones que que aplican pruebas estadísticas en R es homogénea y predecible.

Estudia los ejemplos de prop.test, que implementa una prueba estadística para comprobar si dos proporciones son o no significativamente distintas.