La regla del tres (para estimar la probabilidad de un evento todavía no observado)

Me acusan (quien lo hizo, si me lee, sabrá identificarse) de repetirme, de contar una historia dos, y sino me paran los pies, tres y más veces. Ya me pasó una vez por aquí. Espero que no me esté volviendo a suceder hoy porque habría jurado haber mencionado este asunto antes.

Es el de la estimación de la probabilidad de eventos todavía no observados. Traduzco y (como no rectoreo universidad pública alguna y, por ende, no puedo permitirme el lujo de copiar sin citar) luego diré de donde:

Supón que estás corrigiendo un libreo. Si después de 20 páginas has encontrados 7 errores, puedes estimar la probabilidad de que una página contenga un error en 7/20. ¿Pero si no has encontrado ninguno? ¿Darías por buena una probabilidad de 0/20, i.e., que el libro contiene tiene ningún error?

tres_unicornios

La regla del tres justifica asignar una probabilidad de 3/n después de revisar n casos sin encontrar ningún evento.

El párrafo del que he traducido junto con una justificación de lo anterior puede encontrarse aquí.

Nota: Después de escribir lo anterior, me doy cuenta de que no solo me he repetido sino que, además, me he contradicho (parcialmente). En esta entrada me refiero a la paradoja del 100% (i.e., cuando un 100% no es un 100%) y sus consecuencias, y lo dicho de ese extremo se pueden aplicar mutatis mutandis al otro extremo.

5 comentarios sobre “La regla del tres (para estimar la probabilidad de un evento todavía no observado)

  1. dan 30 noviembre, 2016 12:00

    Creo falta una palabra fundamental: MENOR.

    Puede estimarse con una confianza del 95 por ciento que la probabilidad de alguna página con alguna errata es MENOR que 3/n.

    Leyendo la entrada de John, lo anterior solo es cierto desde el punto de vista bayesiano si partimos de una situación original de incertidumbre, tomando un prior uniforme, es decir una beta(1,1). Veamos un ejemplo con R:

    Tras leer cien páginas sin ninguna errata el método bayesiano que partía de un modelo uniforme U[0,1] = beta(1,1) para dicha probabilidad, actualiza su creencia tomando un modelo beta(1+0,1+100) = beta(1,101).

    Si decimos entonces que la probabilidad es menor que 3/100 = 0.03 veamos qué confianza asociada tiene:

    pbeta(0.03,1,101) –
    0.9538

    Efectivamente, se puede afirmar al 95,38 %, con los supuestos bayesianos anteriores, que la probabilidad de cometer alguna errata por página es menor que 0.03

  2. Carlos J. Gil Bellosta 30 noviembre, 2016 12:28

    La entrada que cito al final se refiere, precisamente, a lo que comentas. De todos modos, la «regla del tres» es sugerente y se puede aplicar como «criterio rápido y frugal». De hecho, he retomado este asunto por la pregunta de una lingüista que quería estimar la probabilidad de ocurrencia de palabras que no había encontrado en su muestra de textos, pero que bien podrían ocurrir en otros. No la puedo apabullar con lo del reverendo, ¿o sí?

  3. Dan 30 noviembre, 2016 16:56

    Sobre la pregunta de la lingüista, el uso de nuevas palabras depende mucho del contexto, por ejemplo en dos textos de casuística muy distinta puede ocurrir que una palabra no aparezca ninguna vez en un texto y sin embargo aparezca muchas veces en otro, esto se debe a que no se trata de muestras independientes, por tanto, al variar el modelo según el tipo de texto, no sería válido usar esta regla.

    Lo que si parece razonable es que un escritor que hace gala de un vocabulario extenso y preciso en sus textos tiene una mayor probabilidad de usar otras nuevas palabras en sus nuevas novelas.

    En definitiva que si la diferencia de frecuencias en las palabras en dos obras es muy diferente, entonces no parece válido aplicar la regla del tres para usando una obra sacar conclusiones sobre otra. Sin embargo si el caudal léxico y las frecuencias en dos obras son similares entonces sí sería válido la aplicación de la regla anterior.

    Buscando en google algo al respecto: «Shallow Text Analysis and Machine Learning for Authorship Att
    ribution»

  4. Carlos J. Gil Bellosta 30 noviembre, 2016 17:00

    Obvio, pero, ¿cuántas veces lo perfecto mata lo bueno?

    ¿Por qué carajos no nos hacen caso los lingüistas a los matemáticos? Porque en lugar de darles reglas «rápidas y frugales» los llenamos de peros, esgrimimos cauísticas, etc.

    Tú y yo estamos de acuerdo, solo que el lingüista necesita resolver ese problema y tirar p’alante. Con algo suficientemente bueno, aunque no perfecto, evitas que incurra en lo pésimo.

Los comentarios están desabilitados.