De ratios, apuestas y riesgos

Nunca he entendido eso de los odds. Me refiero a eso que mencionan las películas: ocho contra uno a favor de tal, cinco contra tres a favor de cual. Y no creo que sea el único al que le son ajenos. De hecho, la página de la Wikipedia en español correspondiente a la inglesa para odds se refiere a ellas como cuotas, término que jamás hasta hoy había visto así usado. Tampoco lo han visto, se concoce, los lexicógrafos de la RAE.

Entender lo de los odds —dejadme que los llame así— me ha llevado un ratillo. En la Wikipedia se menciona un ejemplo: en una competición hay tres participantes que tienen probabilidades de ganar iguales a 0.5, 0.4 y 0.1. Sus correspondientes odds son 1:1, 3:2 y 9:1. Esto es así porque, por ejemplo, para el tercer participante, 1 / (1+9) = 0.1. En general, para odds a:b, la probabilidad del evento es b/(a+b).

Dicho lo cual, ¿soy el único que prefiere las probabilidades a los odds y las ve más naturales?

Peor aún, existe eso que llaman el odds ratio (OR, por abreviar). El OR entre los dos últimos participantes del ejemplo anterior sería (2/3)/(1/9) = 6. ¿Nadie ve más natural decir que el primero tiene 4 veces más probabilidades de ganar que el segundo? No sé.

Lo que nos conduce a la siguiente cuestión: ¿por qué hablamos tanto del OR en estadística (y sus aplicaciones)? Pues es por culpa del instrumento (o uno de los instrumentos) que usamos para calcular probabilidades, la regresión logística. Es como si los coches midiesen la distancia en términos del número de vueltas que dan las ruedas y no de kilómetros.

En el modelo logístico el coeficiente de una variable binaria (p.e., «tabaco») es el logaritmo del OR. En este caso, el ratio lo es entre los casos en los que dicha variable es 1 y el caso base (donde es 0). En efecto

p_1=\exp(\dots+1\beta+\dots)/(1+\exp(\dots+1\beta+\dots))

y

p_0=\exp(\dots+0\beta+\dots)/(1+\exp(\dots+0\beta+\dots)=\exp(\dots)/(1+\exp(\dots))

Despejando,

\exp(\dots+\beta+\dots)=p_1/(1-p_1)

y

\exp(\dots)=p_0/(1-p_0)

por lo que

exp(\beta)=\frac{p_1/(1-p_1)}{p_0/(1-p_0)},

nuestro OR. Y claro, como \beta tiene asociados intervalos de confianza, etc. uno puede hacer estadística y, por ejemplo, construir gráficos tales como

multiodds1

(Nota: el gráfico anterior está extraído de aquí, la bitácora del autor del paquete sjPlot, con el que se ha generado el gráfico anterior).

Pero, como he discutido más arriba, el OR es difícilmente interpretable (salvo que seas un inglés aficionado a las carreras de galgos).

¿Qué alternativas existen?

Las que más me gustan requieren dos números: la probabilidad del caso base y la probabilidad del caso de interés. Pero tanta cifra atraganta a la gente: los más quieren solo un número. Aunque sea la media. Satisfagámoslos entonces.

Habiendo dos números de interés (las dos probabilidades) una cosa que puede hacerse para dejarlos en uno es dividirlos. A ese cociente se lo llama riesgo relativo. Puede calcularse a partir del or (y de la probabilidad del caso base) como se indica aquí. Quienes dispongan de un boli, una servilleta y un bachillerato cursado con aprovechamiento no necesitarán siquiera seguir el enlace.

Finalmente, que algo sea x veces más probable que otra cosa tampoco es tremendamente relevante si las probabilidades son ínfimas. Por ejemplo, pueden decir que quienes toman el medicamento A tienen 7 veces más probabilidad de sufrir X que los que no. ¿Pero qué si X solo ocurre a una persona de cada millón?

Por concluir, dejo como ejercicio la lectura de este artículo de Spiegelhalter sobre mecanismos human friendly de expresar riesgos relativos (y, por extensión, comparar probabilidades).

3 comentarios sobre “De ratios, apuestas y riesgos

  1. Jorge 12 febrero, 2014 15:30

    Hola, hay una erratilla en los odds que aparecen desde el punto de vista del corredor de apuestas. Lo habitual es que los odds aparezcan al revés de como aparecen: 1:1, 2:3 y 1:9. Así, la interpretación es:
    1: 1 en 2 veces (1+1) gano 1 pierdo 1, es decir, 50% de ganar
    2:3 en 5 veces (2+3) gano 2 pierdo 3, es decir, 40% de ganar
    1:9 en 10 veces (1+9) gano 1 pierdo 9, es decir, 10% de ganar
    Claro, para el corredor de apuestas es al revés (cuando gana el cliente, el pierde).

  2. daniel 12 febrero, 2014 18:36

    En los últimos años se han impuesto otras «odds» con la explosión de betfair, que dicen que mueve más dinero al día que la bolsa de Londres.

    Es bastante sencillo, las odds son 1/Probabilidad. En el caso del que hablamos, las odds del que tiene el 50% de ganar son 2, del 40% 2.5 y del 10% 10.

    Imaginemos por ejemplo un Real Madrid – Osasuna en el minuto 75, donde el marcador es 0-0. Si jugamos al 1X2, las cuotas 2, 2.5 y 10 podrían ser las del mercado. Además, su interpretación es muy sencilla, ya que si apostamos un euro al Real Madrid, recibiremos 2 (doblamos la apuesta), si apostamos a la X, recibiremos 2.5 euros y al Osasuna 10 euros.

    Este portal cuelga, gratuitamente para clientes premium, aproximadamente un millón de registros cada semana en .csv sobre las apuestas que han hecho sus clientes (con cierto nivel de agregación). Un reto para todos los amantes de la modelización estadística.

    Para mí, es algo más «fiable» que la bolsa. Sería bueno formar un «grupo investigador» en este tema.

  3. José Luis 12 febrero, 2014 20:24

    Yo también prefiero las probabilidades sobre los odds y sobre los odds ratios. En un modelo de regresión logística me gusta presentarlo con el gráfico de efectos, como los que se obtienen con el paquete effects de John Fox http://www.inside-r.org/packages/cran/effects/docs/effects pero en la escala de probabilidades en vez de en la logit que es la que viene por defecto

Los comentarios están desabilitados.