Abundando en lo de nuestra ineptitud para estimar la probabilidad condicionada

Antes de seguir leyendo, trate de responder a la siguiente pregunta:

Una familia tiene dos hijos (acá usamos el masculino en forma genérica: pudieran ser de cualquier sexo). Uno de ellos es niño. ¿Cuál es la probabilidad de que el otro sea también niño?

Si su respuesta es 0,5 va a tener que seguir leyendo el resto del artículo. Pero tampoco se deprima: parece que nuestro cerebro está maleado para caer en tal error y así lo parece refrendar una microencuesta que elaboro interpelando a incautos.

Quería basarme en datos de familias del INE para probar lo incorrecto del valor 0,5, pero no existe en la contabilidad nacional un informe del número de hijos por sexo y familia. Así que he fabricado un país artificial con R:

# Para facilitar la replicabilidad del experimento
set.seed( 1234 )

# 1 millón de familias tienen 2 hijos
# La variable n.hijos.varones cuenta el número de varones en cada una de ellas
n.hijos.varones <- rbinom( 1000000, 2, 0.5 ) 

table( n.hijos.varones )
# n.hijos.varones
#      0      1      2
# 250696 499112 250192  

# La probabilidad de tener dos niños cuando se tiene al menos un niño viene dada
# por el siguiente cociente:
sum( n.hijos.varones == 2 ) / sum( n.hijos.varones > 0 )
# 0.3338992

¡La respuesta es próxima a 1/3! Y éste es precisamente el valor que cabe esperar. De hecho, si X, Y \in {0,1} son variables aleatorias binomiales que indican si el primer o segundo hijo, respectivamente, son niños, entonces:

  1. Cabe esperar que X e Y sean independientes.
  2. Que la probabilidad de que tomen el valor 1 sea 1/2.

El enunciado del problema indicado más arriba puede reescribirse matemáticamente se reduce a calcular

 P( X + Y = 2 | X + Y > 0 ),

que es (de acuerdo con la definición de la  probabilidad condicionada)

\frac{P( X + Y = 2 , X + Y > 0 )}{ P( X + Y > 0 ) } = \frac{P( X + Y = 2 )}{ P( X + Y > 0 ) } = \frac{1/4}{ 3/4 } = \frac{1}{3}

También es evidente en la siguiente figura:

La pregunta que ha dado origen al problema puede reformularse, al fin y al cabo así: ¿cuál es la posibilidad de caer en la casilla gris oscuro si se sabe que se ha caído en una casilla gris?

2 comentarios sobre “Abundando en lo de nuestra ineptitud para estimar la probabilidad condicionada

  1. esmm 12 noviembre, 2010 10:37

    La pregunta origen al problema es demasiado abstracta. Se aleja de lo cotidiano. ¡¡Qué es eso de que una familia tiene dos hijos!!

    Teniendo que:
    1. X e Y sean independientes.
    2. la probabilidad de que tomen el valor 1 sea 1/2.

    ¿Y si reformulamos la pregunta a algo MUCHO más (tristemente) cotidiano?. Podría ser algo así:

    Una familia tiene dos MONEDAS de 1 centimo. Al lanzarlas una de ellas HA SALIDO CRUZ. ¿Cuál es la probabilidad de que la otra sea también CRUZ?

  2. datanalytics 12 noviembre, 2010 17:05

    Espero que no llegue el día en el que las monedas sean algo tan sumamente preciado y escaso que se considere un sumo irrespeto utilizarlas como meros generadores de variables aleatorias de Bernuilli…

    En cualquier caso, el problema es viejo. Creo que fue Feller el primero que escrbió sobre él. Y lo haría, imagino, en alguna época de vientres y espermas más fecundos y metros cuadrados más asequibles.

Los comentarios están desabilitados.