Más sobre la ley de Benford (I): una condición suficiente
Las circunstancias —frente a las que soy dócil como el que más— me conducen a escribir de nuevo sobre la Ley de Benford. En concreto, voy a traer a la atención de mis lectores una condición suficiente para que se cumpla. Y de ella extraeremos conclusiones tal vez sorprendentes en sucesivas entradas de la serie que con esta inicio.
Dado un número (p.e., 1234), lo podemos descomponer en dos: una potencia de 10 y otro entre 0 y 10:
n <- 1234 # por ejemplo
suelo <- floor(log10(n))
parte.decimal <- log10(n) - suelo
10^suelo # una potencia de 10
10^parte.decimal # entre 0 y 10
Si lo que llamamos parte.decimal
tiene una distribución uniforme en el intervalo (0,1), entonces la probabilidad de que un número comience por, por ejemplo, 3, será
$$ P\left( 10^{\text{parte.decimal}} \in [3,4) \right),$$
o bien
$$ P\left( \log_{10} 3 \le \text{parte.decimal} < \log_{10} 4 \right),$$
que no es otra cosa que $latex log_{10} 4- log_{10} 3$, el valor que corresponde a la definición estándar de la ley en cuestión.
Así que, en resumen:
Una condición suficiente para que se verifique la Ley de Benford para una serie de valores $latex x_1, \dots, x_n$ es que la parte decimal de los valores $latex \log_{10} x_i$ tenga una distribución uniforme sobre el intervalo (0,1).
(Nota: estoy obviando los signos).