Blog de Carlos J. Gil Bellosta

Carlos J. Gil Bellosta es ex-eBay, ex-BBVA, ex-everis, ex-Barclays, exmatemático, ex-casi todo. No obstante, estadístico diletante, científico de datos, pionero y entusiasta de R, picapedrero de Python y bloguero en los ratos libres de los días de hacer.

Estas páginas reflejan parte de sus gustos e intereses intelectuales y profesionales —los concernientes a la estadística, el análisis de datos, la inteligencia artificial, el data science, la programación y otras disciplinas aledañas— más fielmente que su tortuoso CV.

«Peak population» por municipios

El otro día me entretuve en crear tras ver en Twitter. Muestra, municipio a municipio, el año (censurado por la izquierda en 1996) en el que se alcanzó la población máxima de acuerdo con los datos del padrón. Notas: Como he dicho, la API del INE solo ofrece datos de los últimos 30 años. Los datos anteriores, quién sabrá dónde estarán. He usado el término censura en su acepción estadística. No me he entretenido en representar Canarias. Lo siento. Gran parte del código ha sido desarrollado por Claude. Claude ha sabido, de hecho, identificar la llamada a la API del INE necesaria para bajar los datos correspondientes. El INE ha puesto a disposición de los usuarios un paquete, ineapir que facilita la descarga de datos de sus APIs. Bien. Los límites de los municipios los he bajado en formato GeoJSON del portal del Instituto Geográfico Nacional. Y el código, a continuación (por si alguien quiere seguir jugando con él). ...

5 de marzo de 2026 · Carlos J. Gil Bellosta

Notas (10) sobre economía: del auge de la IA a los artefactos de la paradoja de Simpson los argumentos alrededor de la productividad

Measuring Efficiency and Equity Framing in Economics Research. Tyler Cowen glosa un artículo que utiliza LLMs para analizar más de 27k artículos económicos publicados entre 1950 y 2021 para concluir que el interés por la eficiencia alcanzó su punto máximo a finales de los años ochenta para ser progresivamente desplazado por el interés en la equidad. The Economist As Reporter. Nicholas Decker argumenta que la IA acelerará radicalmente las tareas mecánicas de la investigación económica, liberando a los economistas para hacer algo más parecido al periodismo de investigación: identificar problemas reales, construir argumentos empíricos rigurosos y comunicar los hallazgos al público. ...

2 de marzo de 2026 · Carlos J. Gil Bellosta

Teoría de la decisión bayesiana con NumPyro

Daniel Saunders tiene una entrada en su blog, A Bayesian decision theory workflow en el que utiliza PyTensor para resolver un problema de teoría de la decisión bayesiana (¿es realmente necesario el apellido?) y cuya solución es $3.291507977689139$. El maestro Juan Camilo Orduz —de quien no se puede dejar nunca de aprender— lo replicó en A Bayesian Decision Theory Workflow: Port to NumPyro para obtener $3.27928950$ como solución. Yo ahora recojo el guante y, por lo de bayesiano, llego a ...

25 de febrero de 2026 · Carlos J. Gil Bellosta

Notas (9): Algunos enlaces y comentarios sobre temas estadísticos

Mills ratio and tail thickness — John D. Cook nos habla de la razón de Mills ($\int_x^\infty f(t) dt / f(x)$) para estudiar el grosor de las colas de las distribuciones de probabilidad. Por ejemplo, aunque una distribución t con muchos grados de libertad es muy similar a una normal en la parte central, la razón de Mills las distingue claramente por su distinto comportamiento en las colas. What is “workflow” and why is it important? — Sobre el flujo de trabajo del análisis de datos (con inspiración bayesiana), según Andrew Gelman (y sus coautores). R Workflow es la reinterpretación de Frank Harrell del mismo asunto. ...

23 de febrero de 2026 · Carlos J. Gil Bellosta

Sobre un inesperado factor que convierte subrepticialmente una distribución a priori en informativa

La distribución predictiva a priori es la que se obtiene de un modelo a partir de las prioris, antes de ver datos o realizar ajustes. Se utiliza para evaluar el grado en que las prioris elegidas están dentro de rango y no generan datos que no se parecen en nada a los que se espera por conocimiento previo. El libro Bayesian Modeling and Computation in Python discute las distribuciones predictivas a priori en su segundo capítulo. Allí argumenta alrededor de dos ejemplos. El primero está elegido a propósito para defender el caso de las prioris informativas frente a las objeciones de sus innumerables escépticos. El segundo es más intrigante. Muestra el gráfico ...

18 de febrero de 2026 · Carlos J. Gil Bellosta

Notas (8): código generado por humanos, código inspirado por humanos

Jeff Soules dio una charla sobre buenas prácticas de programación (particularmente acerca de técnicas para mejorar la legibilidad del código) y publicó las correspondientes diapositivas. Guillermo Luijk siempre escribe cosas interesantes. De entre sus últimas: Optimizando el paseo de perros con R Distribuciones normales en la torre de Pisa Perspectiva aérea desde mapa de elevaciones con C++ A Software Library with No Code describe un experimento que muchos considerarán distópico: usando LLMs, se pueden crear y compartir abstracciones reutilizables; en este caso concreto, descripciones detalladas sobre cómo debería funcionar una determinada librería pero sin escribir una sola línea de código tradicional. El usuario de esta metalibrería utilizaría un LLM para obtener una implementación en el lenguaje objetivo de su elección: Python, etc. Hay gente que utiliza LLMs para portar librerías de un lenguaje a otro; esta metalibrería representa un pequeño nivel adicional de abstracción: la descripción de lo que ha de hacer no está descrita en código sino en instrucciones verbales precisas e interpretables por los LLMs. Habría que ver si el lenguaje natural es preferible a código —que es una forma concreta de seudocódigo— para describir lo que se espera de la librería; porque lo que se espera de este (del código) es que sea más específico y menos ambiguo que aquel (el natural) a la hora de describir algoritmos fielmente.

16 de febrero de 2026 · Carlos J. Gil Bellosta

¿Cómo funcionan los addons de Kodi para bajar películas piratas?

Hoy voy a dejar escritas una serie de cosas que he aprendido últimamente investigando sobre un asunto que no es del interés de la gente de bien. La gente de bien, para ver películas (etc.) paga suscripciones a proveedores como Netflix y no se mete en berenjenales. Pero otros usan herramientas tales como addons truchos de Kodi con la esperanza —no siempre realizada— de poder ver películas gratis total. Lo que sigue describe lo que uno descubre cuando investiga cómo hacen esos addons para ofrecer contenidos y cuáles son los sistemas subyacentes que explotan o tratan de explotar. Antes de continuar, no obstante, quiero que consten varias salvedades: ...

11 de febrero de 2026 · Carlos J. Gil Bellosta

Notas (7): de la eficiencia energética de los LLMs hasta su «lenguaje secreto»

Electricity use of AI coding agents es el enésimo intento para desactivar ese meme de que por culpa de los LLMs vamos a quedarnos sin planeta. Persuasion of Humans Is the Bottleneck discute el verdadero cuello de botella en el despliegue de los LLMs: el operador humano. Además del marco legal (y la responsabilidad asociada a él) en el que operan la mayor parte de las organizaciones humanas. Eso sí, incurre en una especie de falacia de Nirvana al dar por hecho que aquello a lo que los LLMs reemplazarían es perfecto, cuando todos sabemos que dista mucho de serlo. Wilson Lin on FastRender: a browser built by thousands of parallel agents trae detalles sobre la construcción de un navegador desde cero usando agentes a mansalva. Todo el mundo parece estar hablando del artículo Behavioral Economics of AI: LLM Biases and Corrections, que estudia si los LLMs actúan o no como se espera del homo œconomicus. Un resultado inesperado es que cuanto mejor es un modelo, más tiende a equivocarse en el mismo sentido que lo haría un humano. How AI Is Learning to Think in Secret trata sobre si los LLMs están construyendo (o van a construir) un lenguaje especial y optimizado para pensar que resulte ininteligible para los humanos. Creía haber leído que en algunos subforos de Moltbook había agentes discutiendo la posibilidad de usar algún tipo de DroidSpeak para comunicarse entre ellos sin las servidumbres del lenguaje humano, pero no he podido encontrarlos; igual lo he soñado. ...

9 de febrero de 2026 · Carlos J. Gil Bellosta

Lista de los ETFs comercializados por ING en febrero de 2026

En 2024 publiqué una lista de los ETFs comercializados por ING. El motivo era que el buscador de entonces dejaba bastante que desear. Luego la actualicé en 2025. Este es el anuncio de la actualización de la información a principios de febrero de 2026. La lista puede consultarse aquí.

6 de febrero de 2026 · Carlos J. Gil Bellosta

Más sobre por qué la IA generativa es menos útil para lidiar con cuestiones jurídicas que en otros ámbitos

Tiene Jesús Alfaro una entrada en su blog, Por qué la AI generativa es menos útil para lidiar con cuestiones jurídicas que en otros ámbitos, cuyo contenido no es enteramente fiel a su rótulo. Aunque aporta razones de peso (y que no voy a cuestionar) sobre los problemas que plantean los LLMs a la hora de resolver cuestiones jurídicas, no acaba de explicar qué cosa concreta los hace precisamente menos útiles que en otros campos. Es decir, aunque anuncia una comparación, luego no la realiza expresamente. El objetivo de esta entrada es comparar el uso de los LLMs en el ámbito del derecho —basándome necesariamente en la entrada anterior en tanto que mi experiencia en esa disciplina es nula— con otros que conozco mejor, matemáticas y programación, para acabar proponiendo una síntesis (en el sentido dialéctico del término). ...

4 de febrero de 2026 · Carlos J. Gil Bellosta