Construcción de prioris informativas a la de Finetti

2016-1-14 (Última modificación: 2016-1-14)

Un banco tiene clientes. Los clientes usan la tarjeta de débito. La pueden usar de dos maneras: en cajero o para pagar (por productos y servicios). De cada cliente se tiene una secuencia de transacciones, etiquetadas como 1 o 0 según la use en cajero o no.

Para cada cliente, la secuencia de transacciones (más o menos larga) puede considerarse una secuencia intercambiable y, de acuerdo con el teorema de representación de de Finetti,

$$ p(x_1, \dots, x_n) = \int_0^1 \prod p(x_i | \theta) p(\theta) d\theta$$

donde $latex p(\theta)$ es una densidad de probabilidad soportada por [0,1]. Esa es la probabilidad a priori y de la que me he ocupado en algunas entradas últimamente. Las sugerencias que uno encuentra en la literatura, según denuncié recientemente, remiten a la teoría de las prioris no informativas y muchos, en estos contextos, se decantarían por una beta $latex B(1,1)$.

Sin embargo, el teorema de de Finetti no queda en la representación anterior. Añade que $latex p(\theta)$ es la densidad correspondiente a la distribución de

$$ \lim_n \frac{\sum_i X_i}{n}$$

que puede aproximarse mediante (en nuestro caso), la colección de los promedios

$$ \frac{\sum_i X_{ji}}{n_j}$$

donde $latex X_{ji}$ es la $latex i$-ésima transacción del $latex j$-ésimo cliente (que realiza $latex n_j$ transacciones).

Y sí, esa es una distribución a priori informativa construida al gusto de de Finetti.

(Que es mejorable si se dispone de información adicional sobre los clientes; pero esa es otra historia).

(Que pueda o no ser aproximable por una beta con determinados parámetros para facilitar las operaciones posteriores es también otra historia).

(José M. Bernardo habla aquí de esa representación y de un problema parecido; pero en el lance de matar, pincha en hueso: acaba proponiendo una de las distribuciones no informativas que recoge en su libro: ¡es que es matemático!)