Como no podemos medir X, usamos Y; pero luego, en las conclusiones, no criticamos Y sino X

Ayer estuve leyendo un artículo (arg, y perdí la referencia; pero da igual para la discusión, porque es genérica) en el que trataba de atribuir diferencias de mortalidad a diversas causas: diabetes, tabaco, alcohol,… y SES (estado socioeconómico).

El gran resultado más reseñable (por los autores) era que un SES bajo implicaba nosecuántos años menos de vida, incluso descontando el efecto del resto de los factores (y no recuerdo si estudiaban las correlaciones entre ellos, etc., como se debe en un estudio con pretensiones causales).

Todo bien. Y tuiter, celebrando la enésima constatación de que ser pobre mata, etc.

Pero los autores del artículo reconocían en la letra pequeña que no habían podido medir el SES directamente sino a través de un proxy que, como todo el mundo sabe, está altamente correlacionado con el SES. Así que la causa, si acaso, era otra. Era algo así como el (¿tipo de trabajo?) trabajo en el último año. Así que lo que mataba era, tal vez, haber sido fontanero en lugar de piloto de avión. O algo así. Que tiene interpretaciones (y sugiere políticas) muy distintas. Pero esa es otra historia.

Lo que más guasa de todo tien es que las correlaciones (positivas) no son transitivas. Podríamos encontrar con cierto tino otra variable que todo el mundo sabe que está correlacionada con el SES pero negativamente con el proxy. Y redactar un artículo con las conclusiones invertidas para divertimento de todos.