Las dos preguntas fundamentales de la teoría de los valores extremos

En muchos ocasiones es necesario realizar estimaciones sobre el máximo de una serie de valores aleatorios.

Uno de los casos más conocidos que me vienen a la mente es el llamado problema de los tanques alemanes. Durante la II Guerra Mundial, los aliados, para estimar el ritmo de producción de tanques del enemigo, recogían el número de serie de los que destruían o capturaban. Gracias a esta muestra potencialmente aleatoria, podían realizar estimaciones del máximo de la serie y, de ahí, del número de unidades construidas durante cierto intervalo de tiempo. Pero este es un problema trivial comparado con el de estimar el máximo nivel que puede alcanzar una riada o la carga que puede llegar a soportar un puente en los próximos cien o mil años.

Dada una sucesión de variables aleatorias independientes X_1, X_2,\dots, si M_n es el máximo de las n primeras, pueden suceder dos cosas obvias:

  • Que las X_i estén acotadas y que su máximo, por lo tanto, tienda a un valor constante.
  • Que no estén acotadas, por lo que el máximo tenderá a infinito.

Pero aunque tienda a infinito, todavía podría ser posible encontrar valores a_n y b_n tales que la distribución de

\frac{ M_n - b_n }{a_n}

no sea degenerada. Nótese que

P \left( \frac{ M_n - b_n }{a_n} < x \right) = P( M_n < a_n x + b_n) = F^n( a_n x + b_n)

En esta última expresión, el exponente n hace tender la expresión a cero (dado que F < 1) pero, por otra parte, la dilatación a_n x + b_n tiende a hacer crecer la base de la potencia.

Las dos preguntas que surgen entonces son:

  • ¿Existe alguna función de distribución G a la que tienda F^n( a_n x + b_n)? De existir, ¿debería tener alguna forma característica?
  • ¿Existe algún tipo de restricción sobre F —aparte de la no acotación, claro— que garantice la convergencia?

La respuesta, en tu biblioteca.