Casillas puede ser un portero mediocre, pero quienes analizan sus números lo son aún más

Voy a hablar de fútbol. Voy a comentar esto. Contiene y argumenta alrededor de

casillas_paradas

que me puso sobre aviso. Y no, no voy a comentar el amateurismo que manifiesta el hecho de representar dos veces la misma magnitud, el porcentaje de paradas, usando dos significantes distintos (la longitud de las barras y el color). Por más de que siembre la sospecha por lo que sigue.

Me preocupa aún más el hecho de que se ignoren los intervalos de confianza, de que no se vaya más allá de lo que enseñan a los críos de once años y el autor se limite construir un diagrama de barras y un discurso alrededor de él.

Analicemos los datos como se espera que hagan los medios de una sociedad madura. El código

library(rvest)
library(plyr)
library(ggplot2)
 
url <- "http://www.20minutos.es/deportes/estadisticas/liga/player_leaders.asp?category=107"
 
pagina <- html(url, encoding = "UTF8")
tablas <- html_nodes(pagina, xpath='//*/table')
tabla <- html_table(tablas[2], header = T)[[1]]
 
tabla <- tabla[, c("Nombre", "Disp.RP", "Par")]
colnames(tabla) <- c("portero", "disparos", "paradas")
 
res <- ddply(tabla, .(portero), transform, 
      lower = prop.test(paradas, disparos)$conf.int[1],
      upper = prop.test(paradas, disparos)$conf.int[2],
      prop  = paradas / disparos)
 
res$portero <- reorder(res$portero, res$prop, I)
 
ggplot(res, aes(y = portero, x = prop, xmin = lower, xmax = upper)) + 
  geom_point() + geom_errorbarh()

descarga el número de tiros a puerta y el de paradas de una página donde constan (los porcentajes son los mismos, luego hay confianza en que la fuente sea común) y genera

casillas_intervalos_confianza

donde se aprecia un manifiesto solapamiento de los intervalos de confianza (al 95%) construidos con prop.test. Las diferencias dejan de parecer ser tan manifiestas. Aún más,

library(lattice)
 
foo <- function(p1, p2){
  paradas1  <- tabla$paradas[tabla$portero == p1]
  paradas2  <- tabla$paradas[tabla$portero == p2]
  disparos1 <- tabla$disparos[tabla$portero == p1]
  disparos2 <- tabla$disparos[tabla$portero == p2]
  prop.test(c(paradas1, paradas2), c(disparos1, disparos2))$p.value
}
 
diferencias <- outer(tabla$portero, tabla$portero, Vectorize(foo))
dimnames(diferencias) <- list(tabla$portero, tabla$portero)
 
significativas <- diferencias
significativas[significativas > 0.1] <- 0.1
 
levelplot(significativas)

compara dos a dos los porteros usando prop.test y permite construir

diferencias_porteros

que representa los p-valores de los contrastes (y donde, por exigencias de la escala de colores, a los p-valores mayores de 0.1 se les ha dado el valor de 0.1). Las parejas de porteros que en la matriz tienen un color azul no tienen una eficacia significativamente distinta. Solo las parejas a las que corresponde el color rosa, ¡solo 3!, lo son.

Puede que Casillas no sea el mejor portero del mundo. Pero le da cien vueltas a determinados comentaristas deportivos.

Y cierro con tres comentarios:

  • A veces, los números no dicen nada y es mejor callarse. Afortunadamente, estoy en una situación en que me puedo permitir aplicarme el cuento. A otros se les exigen resultados, sean ciertos o no, para ganarse el pan. ¡Pobrecicos!
  • La eficiencia de un hospital se mide en términos de estadísticos ajustados por riesgo. No es lo mismo dejarse morir a un infartado que a alguien con una dolencia mucho más leve. Igualmente, no es lo mismo parar un tiro a quemarropa que otro flojón desde fuera del área que da tiempo al portero a peinarse el flequillo. Afortunadamente, nuestra sociedad no está tan enferma como para recoger información detallada sobre la peligrosidad de los tiros a puerta.
  • Pese a mis manifestaciones de rigor matemático, he sido muy consciente mientras escribía lo que precede de este artículo en el que se critica lo que he hecho. A ver si saco tiempo estos días para rehacer el estudio como Gelman manda.

7 comentarios sobre “Casillas puede ser un portero mediocre, pero quienes analizan sus números lo son aún más

  1. Juan V. 13 julio, 2015 11:31

    Niego la mayor, Casillas no es un portero mediocre. Es cierto que los periodistas saben poco de estadística o de visualización de información, pero se supone que de fútbol si deberían saber y no es lo mismo un portero de un equipo que juega con 5 defensas que uno que juega con 3 y tampoco es lo mismo que estorbe el disparo un buen defensa (internacional, por ejemplo) que otro más normalito. Hay más variables futbolísticas…(distancia del disparo, etc..), es decir algunos periodistas analizan sin saber de números, ni de negocio.

  2. José Luis 14 julio, 2015 11:33

    Duda.
    Y si son los datos de toda la temporada en la liga, es decir, no es una muestra. ¿Se puede/debe calcular intervalos de confianza?
    Supongo que habría que decir que el % de paradas de Bravo en la liga 2014/2015 ha sido 79.8% y ya está.

  3. Carlos J. Gil Bellosta 14 julio, 2015 15:58

    Es una muy buena pregunta que en algunos casos no sé responder: ¿qué sentido tienen intervalos de confianza, etc. en censos? ¿Qué pasa en la era del big data, en el que no hay muestras sino que se trabaja con poblaciones enteras?

    En este caso, sin embargo, la respuesta es clara. Lo relevante no es tanto qué pasó en la Liga pasada sino estimar un parámetro inobservable: la habilidad de los porteros. Se puede pensar en cuantificar esta habilidad como la probabilidad de que ataje un tiro a puerta (de la misma manera en que estimas la probabilidad de obtener cara al tirar al aire una moneda). Lo que tenemos es una muestra de tiros y de paradas. Si asumes que las actuaciones son independientes, etc. (¡que es mucho suponer!), tienes el problema típico de la estimación de p a partir de una serie de tiradas.

    Insisto, lo importante no es lo que pasó sino tratar de estimar esa habilidad innata para, por ejemplo, saber a qué atenerse en la Liga siguiente.

  4. José Luis 14 julio, 2015 16:47

    Este tema puede enganchar con los modelos de superpoblación y con estimaciones en modelos mixtos. Supongamos que tenemos los datos de varios años, no sé, desde la liga 92/93 hasta ahora. Podríamos construir un modelo para la proporción tomando como efectos aleatorios las temporadas y los porteros, ya que las temporadas hasta ahora serían una muestra de todas las existentes y futuras temporadas.
    El tema tiene su gracia, como bien dices a veces tenemos los datos de la población entera y en principio no tiene sentido hacer inferencia . Se «perderían» parte de las herramientas que utilizamos, lo cual suena contradictorio, ¿tengo datos de toda la población y puedo hacer menos cosas? ¿Hace falta una nueva estadística?

  5. Carlos J. Gil Bellosta 14 julio, 2015 16:53

    David Hand, en el artículo que mencioné en http://www.datanalytics.com/2014/02/27/d-hand-sobre-estadistica-y-mineria-de-datos/ tiene una discusión que principia así:

    However, data mining problems also often have available the entire population of data: details of the entire workforce of a corporation, of all customers in the database, of all transactions made last year. In such cases notions of significance testing lose their point…

    ¡Hasta ahí puedo copiar!

  6. Adolflow 16 julio, 2015 13:33

    Hay un par de datos fundamentales que se aplican a porteros y delanteros: primer gol marcado/encajado -el que abre la lata- y el que rompe una situación de pérdida de partido o empate. Cualquiera que siga el fútbol, o la liga, tiene esos datos «en su cabeza», aunque hay empresas que se dedican a eso. Cualquiera que ha seguido los últimos años del Madrid sabe de la importancia que ha tenido Casillas en multitud de victorias de su equipo y también de lo mal que hace las salidas -de debajo de los tres palos, en el área pequeña- y de lo mal que defienden las jugadas a balón parado.

    Trabajar con esos datos sería útil, lo demás me parecen, como dices, barras de colores, caramelos en la puerta del colegio.

  7. Carlos J. Gil Bellosta 16 julio, 2015 17:43

    La verdad es que de fútbol sé poco. Creo que desde el mundial no he visto un partido. Imagino –y creo haberlo comentado en la entrada– que esos datos son insuficientes para medir la calidad de un portero. Los he usado como excusa para todo lo demás: comparar en situaciones de incertidumbre, que es la esencia de la estadística y el asunto fundamental de esta bitácora.

Los comentarios están desabilitados.