Incertidumbre en ránkings (o cómo la varianza es la mayor enemiga de la meritocracia)

Tengo por ahí leído y encolado el artículo League Tables and Their Limitations: Statistical Issues in Comparisons of Institutional Performance del perínclito Spiegelhalter que toma una serie de ránkings (de colegios, de hospitales) y trata de medir cuánto tienen de sustancia y cuánto de ruido.

Hace cosas muy similares a las que escribí aquí. Mi entrada, además, cuenta con la ventaja (que lo será solo para algunos) de usar la sintaxis y código de lme4 en lugar de la nomenclatura que más odio para describir los modelos mixtos utilizados.

A un nivel menos operativo, más conceptual y transportable a otros contextos, lo que trata el artículo tiene que ver con la dificultad de deslindar mérito de suerte (que es el nombre que reciben señal y ruido en ciertos contextos), que se desarrolla aquí y en sus enlaces, y que mereció uno de esos seudonóbeles de economía.