De acuerdo con el saber popular, pruebas que rechazan acompañan a intervalos de confianza que no contienen.
Pero
foo <- function(N, p = 0.7){ n <- qbinom(0.975, N, p) tmp <- binom.test(n, N, p) c(tmp$p.value, tmp$conf.int, tmp$conf.int[1] < p & p < tmp$conf.int[2]) } res <- as.data.frame(t(sapply(20:200, foo))) res$n <- 20:200 res[res$V1 < 0.05,]
no tiene cero filas.
El test binomial es exacto mientras que el cálculo de CI es una aproximación, de ahí la discrepancia.
Tanto el CI como el test se basan en aproximar la binomial por la normal. La discrepancia se debe a que para estandarizar en el test suponemos que el verdadero valor de p es el dado por la hipótesis nula (en el ejemplo, 0.7) mientras que en el CI se usa la proporción muestral.
En general, siempre que la desviación típica dependa del parámetro que es objeto del contraste (otro ejemplo es la distribución de Poisson) el CI y el test no son equivalentes.