Sobre los orígenes de la falacia ecológica

Dice la Wikipedia que la primera denuncia de luego conocida como la falacia ecológica hay que buscarlos en Ecological Correlations and the Behavior of Individuals de un tal W. S. Robinson. Cuenta, entre otros ejemplos, cómo existía una correlación positiva entre ser inmigrante y ser analfabeto (según el censo de 1930 de EE.UU.), evidenciada por la tabla

en tanto que si se examinan los mismos datos por divisiones (ciertas agrupaciones de estados que, se conoce, eran más habituales hace tiempo que ahora), se obtiene una representación de la forma

de donde se deduciría una falsa correlación negativa entre ambas variables.

Es decir, con datos individuales, pasar de inmigrante = 0 a inmigrante = 1 aumenta la probabilidad de analfabetismo. Sin embargo, a nivel agregado (o ecológico) bien puede ocurrir que al aumentar la proporción de inmigrantes decrezca la probabilidad de analfabetismo. Obviamente, esto sucede en este caso porque los inmigrantes parecían tener predilección por las zonas más ricas y, por lo tanto, con menores tasas de analfabetismo local.

Obviamente, después de la admonición de Robinson, no hemos vuelto a ver a nadie incurrir en la falacia ecológica. Así que no sé ni para qué escribo al respecto.

Una nota final: lo anterior se parece pero no es exactamente un caso de nuestra paradoja favorita, la de Simpson. Simpson asomaría su cabeza no necesariamente cuando pareciese decrecer el analfabetismo al crecer la proporción de inmigrantes (como en el caso discutido discutido) sino cuando, en cada región, los inmigrantes tuviesen una tasa de analfabetismo menor que los nativos.