Carlos J. Gil Bellosta

Por fecha

Tue, 29 Apr 2025 00:00:00 +0000

Por tema

Tue, 29 Apr 2025 00:00:00 +0000

Temas con más de 50 entradas

anuncio (122) · artículos (62) · causalidad (60) · charlas (52) · ciencia de datos (150) · consultoría (109) · datos abiertos (63) · economía (73) · encuestas (53) · estadística (578) · estadística bayesiana (87) · estadística pública (66) · finanzas (60) · gráficos (149) · ine (74) · libros (63) · mala ciencia (56) · números (197) · paquetes (117) · probabilidad (144) · programación (91) · python (54) · r (680)

Temas con más de 10 entradas (y menos de 50)

anumerismo (28) · apis (13) · big data (22) · bolsa (12) · ciencia (39) · cis (20) · clústering (18) · coronavirus (30) · correlación (25) · cursos (44) · datos públicos (38) · demografía (19) · distribuciones (23) · econometría (16) · educación (14) · elecciones (18) · electricidad (20) · encuestas electorales (14) · energía (13) · epa (24) · epidemiología (20) · error (23) · españa (24) · excel (19) · fundamentos de probabilidad (11) · física (13) · ggplot2 (13) · glm (25) · google (14) · graficaca (32) · grafos (11) · grandes datos (23) · hardware (12) · historia (28) · incertidumbre (11) · inflación (11) · internet (11) · intervalo de confianza (14) · jornadas (26) · llms (33) · madrid (33) · mapas (49) · matemáticas (21) · media (30) · mercados financieros (12) · microdatoses (18) · modelos (37) · modelos mixtos (14) · momo (14) · mortalidad (36) · muestreo (14) · nlp (45) · optimización (13) · outliers (13) · p-valores (19) · paradoja de simpson (16) · paradojas (13) · paralelización (12) · periodismo de datos (32) · poisson (28) · política (29) · predicción (39) · prensa (28) · priori (22) · proyecciones (13) · prueba de hipótesis (13) · random forests (13) · redes sociales (20) · regresión (20) · regresión lineal (14) · regresión logística (22) · riesgo (24) · rpython (11) · sas (43) · scorings (11) · series temporales (26) · sesgo (19) · sicología (14) · sql (20) · stan (46) · supervivencia (15) · teoría de la decisión (24) · trucos (26) · varianza (43) · visualización (11) · vídeos (14) · youtube (20) · ética (11)

Temas con más de una entrada (y menos de 10)

abc (5) · accidentes (4) · agentes (2) · agregador (2) · ai (6) · airbnb (4) · airef (2) · ajedrez (2) · aleatoriedad (2) · algoritmos (7) · alquiler (2) · amazon (3) · anaconda (2) · andalucía (2) · animaciones (4) · anomalías (2) · anonimidad (8) · análisis factorial (2) · apidays (3) · aplicaciones (2) · aprendizaje automático (5) · aproximaciones (3) · apuestas (4) · argentina (2) · arieli (2) · aristóteles (2) · arqueología (2) · artesanía estadística (3) · atribución (3) · auc (4) · aumann (2) · autopistas (2) · ayuntamiento (5) · azar (4) · backups (8) · banca (6) · banzhaf (4) · barcelona (2) · barómetros (2) · bayes (6) · bayesianismo (5) · bde (2) · be-momo (3) · berkson (3) · beta (8) · bibliotecas (2) · bicimad (3) · bigmemory (2) · binomial (5) · bioestadística (4) · bitcoin (3) · blogs (3) · bmi (2) · boe (5) · bootstrap (6) · boxplot (2) · brecha (2) · breiman (10) · brier (3) · bug (2) · bugs (2) · bulos (3) · bélgica (2) · cairo (4) · cajas negras (3) · calibración (2) · calor (2) · cambio climático (10) · caret (2) · cartociudad (6) · cartodb (3) · cartogramas (5) · casillas (2) · cataluña (2) · catastro (3) · catboost (2) · cauchy (3) · causalimpact (5) · cca (4) · cdo (2) · censo (7) · ceros (2) · chatgpt (3) · chi cuadrado (3) · churn (3) · circiter (3) · civio (2) · clasificación (5) · claude (3) · cleveland (3) · cluster (3) · co2 (2) · cocina (2) · coeficientes (5) · colores (2) · comparación de modelos (2) · competición (4) · componentes principales (4) · computación (3) · comunidad (2) · condicional (2) · consumo (2) · contaminación (7) · contrafactual (3) · corpus (2) · costa rica (2) · coursera (4) · covarianza (3) · covid (6) · cran (4) · criptografía (4) · criptomonedas (2) · csic (3) · csv (2) · ctree (4) · cuantil (3) · cuantiles (3) · cuasiconvexidad (2) · cultura (2) · cumpleaños (2) · curtosis (2) · data.table (8) · databeers (5) · datatón (7) · datos (3) · david mackay (2) · dbscan (2) · deep learning (8) · deepseek (2) · defunciones (5) · democracia directa (4) · densidad (2) · derecho (7) · descuento hiperbólico (2) · desempleo (9) · desigualdad (10) · dgt (2) · dhondt (3) · diapositivas (4) · diferencias en diferencias (2) · dinamarca (2) · discontinuidad (4) · discriminación (5) · distancia (7) · distribución hipergeométrica (2) · distribución normal (2) · divulgación (2) · domingo (2) · domótica (2) · dotplots (4) · dplyr (7) · drae (2) · ec2 (2) · economía conductual (2) · eda (4) · ees (4) · efectos heterogéneos (3) · eficiencia (2) · efron (3) · ejes (4) · elpaís (4) · em (2) · embeddings (8) · empleo (3) · endesa (2) · enecovid19 (3) · energía nuclear (2) · enlaces (3) · entrevista (6) · entropía (3) · epistemología (4) · escepticismo (9) · esl (3) · especificidad (8) · estadística descriptiva (2) · estadística robusta (6) · estadística viejuna (3) · estereotipos (2) · estilo (2) · estimación (8) · etfs (3) · euromomo (2) · eurostat (2) · evangelios (2) · evidencia (3) · experimento (2) · explicación (4) · extrapolación (2) · extremistán (3) · factorización (7) · facturas (2) · falacia ecológica (5) · falacias (8) · feather (3) · feller (5) · filosofía (3) · filosofía de la ciencia (6) · fiscal (4) · fisher (8) · forking paths (2) · formación (8) · fotografía (4) · fractales (2) · frases (6) · fraude (5) · frecuencias naturales (3) · frecuentismo (4) · frenología (2) · future (2) · futuros (5) · fútbol (3) · galton (2) · gam (6) · gartner (2) · gbm (6) · gdpr (2) · gelman (9) · generalización (3) · geodesia (3) · geolocalización (4) · ggmap (6) · gigerenzer (6) · git (2) · github (3) · glmnet (2) · glms (2) · goodhart (3) · google ads (2) · gosset (2) · gowex (2) · gpt (2) · gpt-2 (2) · gradiente (3) · grid (2) · gripe (6) · guadalajara (3) · hackatón (2) · hacking (2) · hadoop (3) · harrell (3) · hayek (2) · hexágonos (2) · hipotecas (2) · histograma (3) · histogramas (2) · home server (2) · homeopatía (6) · html (2) · httr (3) · huelgas (2) · hugo (2) · huracán (2) · hypermind (3) · i+d+i (3) · ia (6) · ibex35 (4) · ibm (5) · ideología (3) · igraph (4) · impuestos (10) · imputación (2) · inferencia (4) · información (7) · informática (2) · infradispersión (6) · inmigración (3) · interacciones (5) · interactividad (2) · interpolación (2) · interpretación (2) · intervalo de predicción (2) · inversiones (3) · iot (2) · ipc (2) · irpf (2) · isciii (10) · iva (2) · javascript (2) · jax (2) · jaynes (5) · json (3) · json-stat (3) · julia (4) · jupyter (2) · justicia (5) · jython (2) · k-medias (5) · k-vecinos (3) · kaggle (5) · kahneman (2) · kalman (2) · keynes (2) · kivy (2) · kmeans (2) · knime (2) · kolmogorov (4) · kriging (2) · kschool (6) · laffer (3) · lago (2) · laplace (3) · lasso (2) · lda (3) · le verrier (2) · leaflet (2) · left (3) · lematizador (4) · lenguaje (3) · ley (2) · ley de benford (8) · libor (2) · licencias (2) · lime (3) · lingüística (4) · linux (9) · lm (5) · lme4 (10) · lmer (3) · logaritmo (7) · loglineal (2) · lognormal (3) · lotería (5) · lucas (3) · ludismo (4) · luz frías (2) · lógica (4) · mapreduce (3) · maptools (2) · markov (7) · martingala (3) · matlab (3) · matrices (6) · mcmc (8) · medialab prado (8) · mediana (7) · medicina (2) · meehl (4) · melilla (2) · melt (2) · memoria (5) · mercado eléctrico (8) · mercados de predicciones (6) · meteorología (2) · metodología (7) · mezclas (8) · mgcv (4) · microdatos (10) · microfundamentos (2) · micromuertes (4) · missing values (2) · ml (2) · mmd (2) · modelización (10) · modelo lineal (4) · modelos generativos (5) · modelos gráficos (5) · modelos jerárquicos (3) · momentos (3) · momocalor (4) · mondrian (4) · monedas (2) · monty hall (5) · mooc (4) · movilidad (2) · muestras pequeñas (5) · multidimensionalidad (8) · multinomial (2) · márketing (7) · método delta (4) · mínimos cuadrados (4) · nadaesgratis (6) · neutralidad en la red (5) · ngramas (2) · nls (3) · nmf (9) · normalistán (2) · noticias (6) · numpyro (5) · ocr (3) · odds (5) · odds ratio (2) · odes (2) · onu (2) · opciones (2) · optim (3) · order (3) · ortega (2) · ostagram (2) · p-hacking (2) · pamplona (3) · paradoja de lord (2) · parallel (3) · pareto (2) · paro (5) · parrondo (2) · party (7) · paulos (2) · pca (7) · pearl (3) · peces (2) · pensiones (2) · pequeños múltiplos (3) · percepción (2) · percepción del riesgo (9) · periodismo (4) · permutaciones (2) · perspectivismo (3) · pib (7) · pisa (6) · plagio (4) · platón (2) · plyr (6) · población (8) · pobreza (6) · poesía (2) · polinomios (4) · posteriori (8) · postgres (2) · potencia (3) · precios (3) · precisión (2) · predicciones (3) · predicción conforme (2) · primeros principios (2) · prioris (2) · privacidad (4) · probabilidad subjetiva (2) · probabilidades pequeñas (2) · probabilidades subjetivas (2) · problemas (4) · procesos puntuales (4) · productividad (4) · programación funcional (5) · prompts (3) · prop.test (3) · prophet (2) · provincias (4) · proyectos (3) · psoe (2) · publicidad (3) · publicodes (2) · pxR (2) · pxr (2) · pyro (2) · quetelet (6) · quijote (2) · r cuadrado (3) · r-es (2) · rae (3) · ram (2) · ranger (2) · rankings (2) · rapidminer (5) · rawls (2) · recmap (2) · recomendaciones (6) · red asia (2) · redes bayesianas (8) · redes neuronales (9) · registro civil (3) · regresión de poisson (2) · regresión ridge (2) · regulación (4) · regularización (2) · reificación (3) · remuestreo (5) · renovables (4) · renta (6) · renta básica (2) · replicabilidad (2) · reproducibilidad (6) · reshape2 (3) · reutilización (3) · revoscaler (2) · rmarkdown (5) · rmse (4) · rnn (2) · roc (5) · rolle (3) · ropensci (2) · ropenspain (6) · roseto (2) · rosling (2) · rpart (2) · rstudio (5) · ruido (4) · rulefit (2) · rvest (3) · salarios (10) · sanidad (5) · savage (4) · scala (5) · scikit-learn (2) · scraping (5) · sección censal (2) · segmentación (2) · seio (2) · semivida (2) · sensibilidad (7) · separación (2) · sesgos (3) · sf (2) · shiny (3) · significancia (2) · simulación (8) · sintaxis (2) · sna (3) · sobol (2) · sobredispersión (9) · sobremuestreo (2) · sociología (8) · software (9) · software libre (2) · sofística (4) · sorpresa (2) · sp (2) · spam (2) · spark (9) · sparkr (2) · sparql (2) · spiegelhalter (8) · spss (3) · ssh (3) · stepwise (2) · stl (4) · student (5) · subjetividad (4) · suficiencia (2) · suicidio (8) · superforecasting (2) · svd (5) · svm (2) · t-test (10) · tablas (3) · tablas de contingencia (4) · tablillas (2) · taleb (3) · taller (6) · tamaño del efecto (2) · tartas (4) · taxis (2) · tecnología (9) · temperaturas (2) · tensorflow (3) · teorema (2) · teorema de bayes (2) · teoría de juegos (2) · terremotos (2) · tests ab (3) · tetlock (4) · texto (4) · tidyverse (2) · trabajo (4) · tracemem (4) · transparencia (3) · tráfico (4) · tufte (6) · tukey (5) · twitter (8) · universidad (7) · upc (2) · urbanismo (2) · vacuna (5) · validación cruzada (7) · variables categóricas (6) · variables instrumentales (6) · varian (2) · varios (9) · verosimilitud (7) · von mises (3) · webscraping (4) · welch (3) · wert (3) · wikipedia (7) · wilcoxon (2) · windows (2) · wolfram (2) · wps (5) · xgboost (4) · xkcd (2) · z-score (2) · z3 (2) · zaragoza (2) · zeileis (2) · álgebra (2) · álgebra lineal (2) · árboles de decisión (9)

Temas con una única entrada

20n (1) · 3d (1) · 3pl (1) · abductivo (1) · abenjaldún (1) · abscisas (1) · academia (1) · accionabilidad (1) · acos (1) · actuarios (1) · adagio (1) · adversarios (1) · aemet (1) · aeropuertos (1) · agate (1) · akaike (1) · albacete (1) · albedrío (1) · alberto olmos (1) · algoritmos genéticos (1) · alia (1) · alicante (1) · almacenamiento (1) · alturas (1) · amigos (1) · anacor (1) · anderson (1) · anomalydetection (1) · anosim (1) · anova (1) · anticonferencia (1) · antifragilidad (1) · antivirus (1) · antropocentrismo (1) · análisis dimensional (1) · análisis pre-post (1) · apr (1) · aprendizaje por refuerzo (1) · aragonés (1) · archeochron (1) · archlinux (1) · aritmética (1) · arm (1) · arquetipos (1) · arte (1) · artefactos (1) · arules (1) · ash (1) · australia (1) · autoencoders (1) · automatización (1) · automl (1) · autores (1) · avast (1) · babilonia (1) · bagging (1) · balanceadores de carga (1) · baloncesto (1) · bamlss (1) · bart (1) · bases de datos (1) · baterías (1) · bernoulli (1) · bert (1) · betabeers (1) · bienes públicos (1) · binequality (1) · binomial negativa (1) · biplots (1) · birrieza (1) · blas (1) · blockchain (1) · bm25 (1) · bne (1) · bolas (1) · boosting (1) · borges (1) · botín (1) · box (1) · bump charts (1) · bunge (1) · burr (1) · c++ (1) · cabify (1) · cache (1) · calcetines (1) · calendario (1) · cambio régimen (1) · cambios estructurales (1) · cambridge analytica (1) · campañas (1) · canoas (1) · car (1) · cartografía (1) · cast (1) · cbc (1) · censos (1) · censura (1) · cercas (1) · cern (1) · ceteris paribus (1) · ceuta (1) · changepoint (1) · charlastanes (1) · chino (1) · chrome (1) · ciencias sociales (1) · cine (1) · ciudad inteligente (1) · clara (1) · clima (1) · cloudnumbers (1) · coche eléctrico (1) · coches (1) · cocreta (1) · codificación (1) · cohen (1) · cohere (1) · coin-or (1) · cointegración (1) · colegios (1) · comercio (1) · command-r+ (1) · comparaciones múltiples (1) · compiladores (1) · complejidad (1) · complutense (1) · computación cuántica (1) · computing (1) · comunicación (1) · conclusión repugnante (1) · confianza (1) · conjunción (1) · conocimiento (1) · constroptim (1) · constrOptim (1) · contratos (1) · convenciones (1) · convergencia (1) · convexidad (1) · copilots (1) · correcciones (1) · correos (1) · correspondencias (1) · cournot (1) · coña (1) · crecimiento exponencial (1) · crecimiento lineal (1) · crimen (1) · croquetas (1) · crps (1) · crédito (1) · cuadrados (1) · cueva (1) · cuped (1) · curiosidades (1) · curva logística (1) · curva roc (1) · código abierto (1) · cópulas (1) · d de cohen (1) · dados (1) · dalex (1) · dalmau (1) · data.tree (1) · dbf (1) · de morgan (1) · decaimiento exponencial (1) · deming (1) · denoising diffusion (1) · deoptimr (1) · deriva (1) · desigualdades (1) · desolve (1) · diaconis (1) · diagramas causales (1) · diccionario (1) · diccionarios (1) · diesel (1) · digitalización (1) · diplomatura (1) · diputados (1) · dirac (1) · direcciones (1) · dirichlet (1) · discretización (1) · diseño experimental (1) · dispersión (1) · distribución de electricidad (1) · distribución uniforme (1) · diversidad (1) · dlagm (1) · dlm (1) · doble ciego (1) · domingos (1) · doping (1) · drogas (1) · dualidad (1) · duckdb (1) · dumbar (1) · eco (1) · ecología (1) · ecuaciones (1) · edad (1) · efectos (1) · efectos aleatorios (1) · effects (1) · ejercicios (1) · elbo (1) · eldiario (1) · elipses (1) · elo (1) · embalses (1) · emd (1) · emigración (1) · emt (1) · encodings (1) · energía hidráulica (1) · energía solar (1) · ensamblador (1) · ensayos clínicos (1) · ensembles (1) · enseñanza (1) · entornos (1) · entrenamiento (1) · epf (1) · equivalente cierto (1) · ergodicidad (1) · errores (1) · escalabilidad (1) · escaleras (1) · escocia (1) · escohotado (1) · esperanza de vida (1) · espías (1) · estacionalidad (1) · estadísica (1) · estadística cualitativa (1) · estadística espacial (1) · estadística frecuentista (1) · estadística oficial (1) · estándares (1) · etiqueta medioambiental (1) · euribor (1) · eventos (1) · eventos improbables (1) · evidencialidad (1) · evt (1) · evtree (1) · exactitud (1) · expertos (1) · exponencial (1) · expresiones regulares (1) · exámenes (1) · eólica (1) · facebook (1) · facetas (1) · factominer (1) · factores de bayes (1) · fair source (1) · falsos negativos (1) · felicidad (1) · feria del libro (1) · ferrocarriles (1) · feyerabend (1) · filtro de kalman (1) · finlandia (1) · fisiognomía (1) · flexmix (1) · fomenko (1) · foreach (1) · foreign (1) · formas (1) · formatos (1) · foros (1) · fotos (1) · fourier (1) · fractal (1) · frecuencia (1) · frugal (1) · fugas (1) · funciones no lineales (1) · función de enlace (1) · función logísitica (1) · función logística (1) · function calling (1) · fundamentos (1) · fundamentos de la probabilidad (1) · fusión nuclear (1) · fuzzy (1) · g-test (1) · gamma (1) · gams (1) · gapminder (1) · garch (1) · garoña (1) · gauss (1) · gcdnet (1) · gcp (1) · generalized random forests (1) · genética (1) · geocentrismo (1) · geometría (1) · geomárketing (1) · geosphere (1) · geozoning (1) · gephi (1) · gestión de proyectos (1) · gijón (1) · glmer (1) · glop (1) · goals based investment (1) · google analytics (1) · google refine (1) · googlemaps (1) · gotham (1) · gpl (1) · gpu (1) · gpus (1) · grados de libertad (1) · grados libertad (1) · gRain (1) · granada (1) · gravedad (1) · grf (1) · grok (1) · groq (1) · grupo de control (1) · guerra nuclear (1) · guis (1) · gumbel (1) · h3 (1) · hamiltoniano (1) · hana (1) · harari (1) · hash (1) · hawking (1) · hdf5 (1) · healy (1) · heath (1) · heatmap (1) · hechos estilizados (1) · helium (1) · herbart (1) · heráclito (1) · heterogeneidad (1) · heurísticas (1) · hiperbólica (1) · hipótesis de la variedad (1) · hispanoamérica (1) · historia de la estadística (1) · hmisc (1) · hora (1) · horarios (1) · hospitales (1) · hume (1) · hunspell (1) · hyperloglog (1) · iberia (1) · ide (1) · identificabilidad (1) · ides (1) · ign (1) · ilusión óptica (1) · iml (1) · importance sampling (1) · imputación múltiple (1) · imágenes (1) · incendios (1) · incentivos (1) · incrementalidad (1) · independencia (1) · indicadores (1) · individualismo metodológico (1) · indra (1) · indultos (1) · inferencia fiduciaria (1) · informe (1) · ing (1) · ingeniería (1) · ingeniería estadística (1) · inks (1) · inla (1) · insaculación (1) · instagram (1) · instalación (1) · intervalos de confianza (1) · intradiario (1) · investigación (1) · io (1) · ipt (1) · ipython (1) · iris (1) · irt (1) · iso (1) · isolation forest (1) · istac (1) · iv (1) · jackknife (1) · jags (1) · japón (1) · java (1) · jotdown (1) · jumpshot (1) · kant (1) · kaplan-meier (1) · kelly (1) · keras (1) · kernel trick (1) · kernsmooth (1) · kgode (1) · kml (1) · kmlshape (1) · knight (1) · lapuente (1) · latin1 (1) · latour (1) · lattice (1) · lazard (1) · lazy evaluation (1) · le Carré (1) · lectura (1) · lecturas (1) · legislación (1) · lema de ito (1) · letalidad (1) · letras (1) · ley de beer (1) · libro holandés (1) · licenciatura (1) · licitaciones (1) · lidar (1) · lindy (1) · lisp (1) · literatura (1) · lluvia (1) · logo (1) · logspline (1) · londres (1) · lopd (1) · loterías (1) · ltv (1) · luz (1) · macros (1) · magriter (1) · magrittr (1) · mamba (1) · manipulación (1) · mareas (1) · margen comercial (1) · marketing (1) · mass (1) · matplotlib (1) · matriz de confusión (1) · maxwell-boltzmann (1) · mcp (1) · mds (1) · mecánica (1) · media geométrica (1) · memes (1) · memisc (1) · meritocracia (1) · metro (1) · metropolis (1) · mfa (1) · mgm (1) · microsoft (1) · migraciones (1) · miró (1) · miscelánea (1) · mixexp (1) · mixtape (1) · mixtral (1) · mixturas (1) · mob (1) · model4you (1) · modelización estadística (1) · modelos bayesianos (1) · modelos lineales (1) · modelos longitudinales (1) · modelos probabilísticos (1) · modelplotr (1) · momocs (1) · moneyball (1) · monitores (1) · monitorización (1) · monolith (1) · MonoPoly (1) · monosemanticidad (1) · morosidad (1) · mosaico (1) · motif (1) · movilidad social (1) · movimiento browniano (1) · mrp (1) · multimodalidad (1) · multivarianza (1) · municipios (1) · murcia (1) · mvbutils (1) · mxnet (1) · máxima verosimilitud (1) · mérito (1) · naive bayes (1) · nannyml (1) · nepotismo (1) · netezza (1) · networktree (1) · neyman (1) · nhst (1) · nimble (1) · ninis (1) · nodejs (1) · normalización (1) · novelas (1) · nowcast (1) · nubes (1) · nutriscore (1) · nvidia (1) · números aleatorios (1) · obituarios (1) · obsidian (1) · oecd (1) · oferta (1) · off-topic (1) · offset (1) · omics (1) · onls (1) · onodo (1) · opacidad (1) · openai (1) · openzmeter (1) · operacionalismo (1) · opinión (1) · oposiciones (1) · or-tools (1) · oracle (1) · ordenadas (1) · outer (1) · p-curva (1) · padrón (1) · palabras (1) · palmtree (1) · pam (1) · pandas (1) · paracaídas (1) · paradoja de berkson (1) · paralelismo (1) · parametrización (1) · paripé (1) · parlamento (1) · parquet (1) · pascal (1) · patentes (1) · paypal (1) · país (1) · pc-axis (1) · pd (1) · pdf (1) · pearson (1) · películas (1) · pergamino (1) · peter (1) · petróleo (1) · pi (1) · pipes (1) · pirrón (1) · pirámide de edad (1) · placebo (1) · plan e (1) · playfair (1) · plotly (1) · plotrix (1) · pocket (1) · podcast (1) · podemos (1) · policía (1) · politibot (1) · politikon (1) · pooling (1) · popgraph (1) · portugal (1) · positron (1) · postgis (1) · postmodernismo (1) · powerpoint (1) · precioestato (1) · prejuicios (1) · preprocesamiento (1) · prerregistro (1) · presentaciones (1) · prevalencia (1) · prim (1) · principio de indiferencia (1) · principio de mediocridad (1) · prioris informativas (1) · probabilidad condicional (1) · probabilidades conjuntas (1) · probabilidades marginales (1) · probabilismo (1) · probabilorismo (1) · probit (1) · problema (1) · procesamiento de imágenes (1) · prof.tree (1) · programación lineal (1) · progreso (1) · proj (1) · promedios (1) · propagación (1) · propagación de errores (1) · propagate (1) · pulp (1) · pulpo (1) · purrr (1) · pytimetk (1) · pérdida (1) · Q* (1) · qgraph (1) · quincuncio (1) · r consortium (1) · r-consortium (1) · r-help-es (1) · r2 (1) · racionalidad (1) · radix (1) · rag (1) · raking (1) · random (1) · raster (1) · rcpp (1) · rcts (1) · readxl (1) · recencia (1) · reciclaje (1) · rectángulos (1) · recurrente (1) · recursividad (1) · redes (1) · redis (1) · redondeo (1) · ree (1) · referéndums (1) · regex (1) · registro mercantil (1) · regla de edlin (1) · regla de eldlin (1) · regresión discontinuidad (1) · regresión no lineal (1) · regresión por cuantiles (1) · relatividad (1) · relativismo (1) · renta básica universal (1) · reshape (1) · resíduos (1) · retina (1) · reveal (1) · rgdal (1) · rgl (1) · ridge (1) · riesgo relativo (1) · rio (1) · rioja (1) · rjava (1) · rjdbc (1) · rjsonio (1) · rlof (1) · rmr2 (1) · robustbase (1) · rodeo (1) · roi (1) · romer (1) · rpca (1) · rsa (1) · rss (1) · rtb (1) · rtc (1) · rutas (1) · rv (1) · salamanca (1) · salud pública (1) · samian (1) · santander (1) · scihub (1) · sdmx (1) · secreto estadístico (1) · segmentación de imágenes (1) · seguridad (1) · seis sigma (1) · seismic (1) · selección de variables (1) · selectividad (1) · semilla (1) · sequía (1) · serfling (1) · sesgo de supervivencia (1) · sexo (1) · shannon (1) · shapley (1) · shell script (1) · shinyapps (1) · shopping (1) · siane (1) · sigmoide (1) · similitud (1) · siquiatría (1) · sir (1) · siria (1) · sistemas (1) · sistemas complejos (1) · sistemas de recomendación (1) · smart city (1) · snow (1) · sobreajuste (1) · sociología normativa (1) · socks (1) · socr (1) · sofística estadística (1) · sokal (1) · solo (1) · solow (1) · solucionismo (1) · sort (1) · sorteos (1) · spdep (1) · spinoza (1) · splines (1) · spufford (1) · spyder (1) · sql server (1) · stable diffusion (1) · stackoverflow (1) · stanarm (1) · stationaRy (1) · stealthflation (1) · stigler (1) · stiglitz (1) · storr (1) · suavizado exponencial (1) · subastas (1) · subjetivismo (1) · subsidios (1) · subvenciones (1) · sumatorio (1) · sunstein (1) · superpredictores (1) · superviviencia (1) · surveillance (1) · svb (1) · svi (1) · sweave (1) · swirl (1) · syberia (1) · t-sne (1) · tabarrok (1) · tabla de mortalidad (1) · tabulizer (1) · tasa tobin (1) · tcl (1) · telegram (1) · telepatía (1) · temporalidad (1) · tenerife (1) · teorema central del límite (1) · teoremas de imposibilidad (1) · teoría (1) · teradata (1) · termodinámica (1) · terra (1) · terrazas (1) · terrorismo (1) · tesis (1) · tezanos (1) · tfm (1) · tfprobability (1) · thaler (1) · thyssen (1) · tibshirani (1) · tiempo (1) · tiobe (1) · tipsters (1) · tirole (1) · tm (1) · tokenización (1) · tolstoi (1) · train-test (1) · travis (1) · treemaps (1) · trellis (1) · trtf (1) · tsintermittent (1) · tsne (1) · tsp (1) · turing (1) · turismo (1) · turnos (1) · turquía (1) · tve (1) · tversky (1) · técnica (1) · uc3m (1) · umap (1) · unicode (1) · unix (1) · unvotes (1) · urss (1) · utf8 (1) · utilidad (1) · utilitarismo (1) · vacunas (1) · vademécum (1) · valencia (1) · vapnik (1) · variabilidad (1) · variables aleatorias (1) · varimax (1) · vcrpart (1) · vectorización (1) · vegan (1) · vibe coding (1) · videjuegos (1) · vim (1) · violencia (1) · vitruvio (1) · vivienda (1) · vizhealth (1) · viñetas (1) · volkswagen (1) · von neumann (1) · votaciones (1) · vscode (1) · wasserstein (1) · watchmen (1) · watson (1) · web-scraping (1) · weldon (1) · whisker (1) · wifi (1) · will smith (1) · windson (1) · woe (1) · wordcloud (1) · wordpress (1) · worlde (1) · xbox (1) · xlconnect (1) · xlsx (1) · xts (1) · yeoman (1) · zillow (1) · zombis (1) · zoo (1) · zsh (1) · álgebra de variables aleatorias (1) · árboles (1) · árboles frugales (1) · árboles olvidadizos (1) · áreas pequeñas (1) · índices (1)

¿Está empeorando la calidad de las estadísticas públicas? (y algunos asuntos más)

Tue, 08 Apr 2025 00:00:00 +0000

En Faulty Speedometers se discute el creciente problema de calidad en determinadas estadísticas de la ONS (el INE británico). Acerca de la EPA de allá, dice:

La caída de la tasa de respuesta no ha sido uniforme en todas las categorías demográficas y la ONS se ha visto obligada a aplicar cada vez más hipótesis y datos imputados a la hora de estimar el número de empleados, la tasa de paro y la tasa de inactividad. El resultado han sido estadísticas oficiales del mercado de trabajo que parecen ser simplemente incorrectas.

En España estamos muy lejos de que tal ocurra porque somos mucho más posmo: la tasa de paro es aquello que calcula el INE en aplicación acrítica de la metodología para calcular la tasa de paro y no ha lugar siquiera a preguntase con la similitud de esos números con la realidad porque esta no existe.

En Inflation and relative prices discute John Cochrane una paradoja: en los países de la Zona Euro, la inflación, por definición, es la misma: está basada en el valor del dinero y, compartiendo moneda, es imposible que difiera. Sin embargo, la inflación, tal cual la calculan organismos estadísticos de cada país, muestra diferencias significativas. Al final, aventura dos posibles razones:

Que tiene que ver con los productos no exportables (p.e., cortes de pelo).
Que refleje algún artefacto en la manera en que se calculan los índices de precios.

Del titulo, Coal, AI & Jevons, se infiere casi todo lo que trata el artículo (supuesto que uno sepa a qué se refieren las tres palabras que lo componen).

Un médico, Dinomight, analiza aquí el impacto de cierto tipo de salarios mínimos —y muestra su escepticismo al respecto— mejor que lo verás en muchas otras partes, especialmente de economistas que escuchan constantemente la voz de su amo.

En Are American rents rigged by algorithms? discute The Economist el siguiente asunto:

Existe un determinado mercado más o menos competitivo.
Alguien crea un algoritmo para determinar los precios a los que ofrecer los productos en dicho mercado. Nótese que poner precios a las cosas es un problema mucho menos simple de lo que piensan muchos. Especialmente los que no se han visto en la tesitura de tener que hacerlo.
Los agentes que operan en ese mercado usan el algoritmo en cuestión.
¿Es eso equivalente a una colusión para fijar precios?

¿Qué ocurre si en un mercado hay un precio óptimo y un algoritmo es capaz de calcularlo? Pero si todos usan ese precio óptimo, ¿no es más óptimo entonces subirlo? Etc.

Vitalik escribe sobre las externalidades positivas de los mercados de predicciones en tanto que proveen de información al público en general. Discute además mecanismos para exprimir al máximo dichas externalidades a través de lo que llama info-finance, un concepto más etéreo del que los mercados de predicciones son la faceta más concreta.

The Black-Scholes-Merton Options Pricing Equation es una leccción sobre elasunto que tiene el formato de una conversación entre Tyler Cowen y Alex Tabarrok. Como cabe esperar de ellos, se discute la historia de la ecuación y en particular —y es algo que desconocía—, a las ideas precursoras de Luis Bachelier.

Si la incertidumbre existe solamente en la mente, entonces, ¿por qué...?

Thu, 03 Apr 2025 00:00:00 +0000

He escrito ya alguna vez sobre esa especie de que la incertidumbre y el azar no existen en el mundo. Que esos conceptos —junto con la teoría de la probabilidad que los sistematiza— son solo una construcción de la mente y existen solamente en ella. Que si no fuésemos tan perezosos, podríamos recopilar todas las causas y deducir con precisión milimétrica el futuro (como hacen Diaconis y compañía en el artículo que traté aquí con los lanzamientos de monedas), y advertiríamos que en el mundo real solo hay certidumbres. Etc.

Mi posición al respecto es que:

La discusión es irrelevante y aporta poco o nada.
Admito que es un tema entretenido para animar una conversación lúdica y evitar temas como el fútbol o la tele.
Aunque la teoría sobre la naturaleza epistemológica de la incertidumbre (por darle un nombre) fuese cierta, nada cambiaría: los problemas que solucionamos usando técnicas estadísticas/probabilísticas seguirían estando bien planteados (además de seguir siendo relevantes, significativos y no exentos de una dimensión lucrativa).

Pero demos la hipótesis por buena: el azar es solo algo en lo que pensamos pero que no tiene un reflejo en el mundo real. Entonces, patrones como

que aparecen en los libros que discuten las propiedades matemáticas de la incertidumbre serían ajenos al mundo material. Pero, entonces, ¿cómo se es que existen

, o tantas otras imágenes de la misma naturaleza? ¿Por que estarían empeñada la realidad en imitar formas que solo imaginan nuestras mentes?

Un par de paradojas de la teoría de la probabilidad y algunos asuntos más

Tue, 01 Apr 2025 00:00:00 +0000

Comienzo la entrada de hoy con un enlace al muy denso Interpretations of probability, en la Enciclopedia de Filosofía de Stanford que, admito, no será del interés de la mayoría.

Podría llegar a decirse —aunque no me atreveré a tanto— que en toda disciplina intelectual tiene que haber paradojas porque de otra manera, sería indistinguible del uso sistemático del sentido común. Así que hoy traigo a colación este análisis de un caso particular de la paradoja de Berkson (que se añade a las ocasiones en las que ya me he referido a ella) y este otro sobre la de Lindley. La primera tiene que ver con la correlación que aparece entre dos variables aleatorias independientes cuando de repente observamos información concomitante; la segunda, con los test de hipótesis (asunto del que, por fortuna, me he mantenido alejado durante largo tiempo).

Acerca de este último asunto y de los p-valores trae Gelman un par de entradas interesantes, Understanding p-values: Different interpretations can be thought of not as different “philosophies” but as different forms of averaging y 4 different meanings of p-value (and how my thinking has changed). La última de las interpretaciones de los p-valores del segundo artículo es:

Un p-valor es el resultado de unas operaciones aplicadas a unos datos que recibe por convención la etiqueta de p-valor.

Finalmente, dos apuntes adicionales. El primero, sobre la construcción del llamado ruido azul, que puede entenderse como muestreos de una variante de la distribución uniforme más uniforme de lo que realmente es. En efecto, la representación de muestra de una distribución uniforme bidimensional es una especie de gris, pero un gris que no se percibe como uniforme. Si se le añade además algún tipo de dispersión aparecen necesariamente zonas con un gris más claro y otras con uno más oscuro:

El ruido azul permite obtener distribuciones uniformes más uniformes y los viejos del blog lo habrán relacionado con las sucesiones de Sobol y lo que llamé probabilidades hirsutas y pocholas.

El segundo, una discusión sobre los odds para representar y comunicar probabilidades que, sin negarle interés, omite dos cuestiones importantes:

Que es un sistema primitivo y obsoleto de pensar en las probabilidades de eventos.
Pero que, desafortunadamente, el papel fundamental de la regresión logística ha ayudado a perpetuar.

Un año más, llega el día internacional de la copia de seguridad

Mon, 31 Mar 2025 00:00:00 +0000

Hoy, como cada 31 de marzo, se celebra el día de la copia de seguridad.

Así que ya sabéis qué hacer:

Coda

Revisando mis archivos, vi que ya hablé del asunto en 2015, 2017, 2023 y 2024.

Otra coda

Creo que alguna vez lo comenté, pero uso syncthing para mantener sincronizado (y replicado) mi contenido más importante entre mi ordenador de sobremesa, el portátil y el servidor doméstico (que está encendido 24/7).

Ahora el blog tiene una lista de entradas relacionadas construida usando LLMs

Thu, 27 Mar 2025 00:00:00 +0000

He implementado las entradas relacionadas en el blog. Dos entradas están relacionadas cuando el producto escalar de sus embeddings es alto.

Así que en primer lugar he asociado a cada entrada un embedding. Las entradas son ficheros de markdown con un preámbulo en yaml. Los embeddings no están creados directamente sobre el texto bruto de la entrada sino sobre la entrada y algunos de los elementos, no todos, del preámbulo.

He usado el modelo text-embedding-004 de Google aunque no podría razonar muy convincentemente la decisión. Quise saber si hay algún tipo de embedding que funcione particularmente bien en español y no llegué a ninguna conclusión convincente. Hay algunos modelos de embedding que los buscadores mencionan cuando en tu búsqueda yuxtapones “embedding” y “español”, pero no sé si aparecen porque han sido entrenados primordialmente con textos en español, porque son particularmente buenos en español, o porque son cuñados de ALIA, MarIA y todas esas cosas hipersuperdupercomputercenterbarlenoniensis.

Sobre el producto escalar no voy a abundar.

El paquete python-frontmatter es muy útil para editar el preámbulo y añadirle extensiones no contempladas explícitamente en Hugo.

La parte más delicada del proceso es modificar la plantilla de Hugo para que muestre las entradas relacionadas. He seguido la que creo que es la vía del mínimo esfuerzo, consistente en:

Identificar otro componente del blog similar en aspecto y función: el widget de “últimas entradas publicadas”.
Copiárselo a Gemini y pedirle que lo transforme en otro que dé cuenta de las entradas relacionadas, que, para cada entrada, es una lista disponible en el preámbulo.
Copipegar la respuesta de Gemini en el lugar adecuado.
Realizar otros ajustes necesarios para concluir satisfactoriamente el proyecto, como activar el nuevo widget en la barra lateral (añadiendo su nombre a un vector en el fichero de configuración) y alguna otra modificación menor. Por supuesto, bajo la permanente guía de Gemini.

No lo clava siempre pero, en general, la evidencia circunstancial parece indicar que funciona bastante bien y que puede resultar útil.

Una nueva selección de novedades relevantes del mundo de los LLMs

Tue, 25 Mar 2025 00:00:00 +0000

Todo el mundo lleva días hablando del MCP. Creo que ni merece la pena decir qué cosa es.

MCP es un mecanismo para empoderar agentes. Para los primeros que creé utilié CrewAI pero he migrado a LangChain porque:

A CrewAI le encantan las dependencias tochas: para cualquier trivialidad crea entornos de varios GB.
CrewAI está diseñado para un tipo de agentes muy concreto —agentes a los que se delega enteramente el control del flujo del proceso— que no son exactamente los que más me interesan ahora –que suelen incluir un elemento de control por mi parte—.

Aunque todo el mundo habla de LangChain y CrewAI, hay algunas innovaciones interesantes, entre las cuales:

PydanticAI y
smolagents que tiene algunas características particulares muy interesantes, como que en lugar de depender (tanto) de herramientas, está construido alrededor de la filosofía de diseño de que el LLM es capaz de generar código en Python y ejecutarlo por su cuenta. No hace falta, pues, proporcionarle una herramienta “calculadora” habida cuenta de que el LLM subyacente es capaz de escribir las operaciones necesarias en Python y ejecutarlas (miedín!) directamente.

Se dice que el prompting es flor de un día y que dentro de no mucho no hará falta estar al tanto de sus (actuales) sutilezas. Por el momento, en todo caso, parece que basta con crear prompts suficientemente buenos (aunque, supongo, suficientemente bueno significa cosas distintas entre los expertos que entre los legos; además, hay opiniones para todo).

Una cosa que no tengo clara aún es si los embeddings (y otros aspectos de los LLMs) funcionan igualmente bien en inglés que en las otras lenguas. En ocasiones me ha dado la sensación de que en español no conseguía resultados tan espectaculares como los de otra gente en la lengua del imperio de verdad. Aparentemente, los buenos amigos de Jina han construido unos embeddings multiidioma que son capaces de agrupar por significado independientemente del idioma en el que este venga escrito.

Salvo que alguien tenga a bien sugerirme algo mejor, creo que voy a comenzar a usar Msty y a alimentarlo con mis notas de Obsidian, con el código fuente de mi blog, el del blog secreto, y los gigas de libros que guardo en Calibre.

Algunas aplicaciones y usos de los LLMs que he recogido en estas últimas semanas:

Una guía práctica de cómo usar los LLMs para desarrollar código.
Otra de cómo implementar DeepSearch/DeepResearch
Xata Agent es un agente de código abierto que monitoriza tu base de datos, encuentra la causa de los problemas y sugiere soluciones y mejoras.
He estado usando también una serie de modelos de audio (que están mejorando a marchas forzadas) para un proyecto del que no puedo decir nada.
John D. Cook usa Grok 3 para generar imágenes que le ayuden a recordar números (de acuerdo con el código fonético de memorización).
Se de que o3-mini es muy bueno para escribir documentación de proyectos de software.
Y quiero dejar anotado en algún sition que es muy entretenido jugar con InstantID y fotos de uno, aunque supongo que ya existirán alternativas infinitamente mejores en el mercado (un mercado que me es ajeno porque no estoy metido en la generación de imagen y vídeo).

Por si alguien no lo ha visto aún, 3Blue1Brown tiene un vídeo sobre la atención en los transformers. Muy recomendable. Como casi todo lo del canal.

La función GELU es $x\Phi(x)$ —$\Phi$ es la función de distribución de la normal estándar— aunque en la práctica se usan aproximaciones.

Aquí se lee:

En cierto sentido, [el éxito de la IA generativa] es el triunfo de la estadística sobre la lógica.

Este es el artículo del que todo el mundo hablaba hace unas semanas: ese en el que a unos LLMs los reentrenaron con código que contenía problemas de seguridad y, como consecuencia (¿como consecuencia? ¿como la única consecuencia?), comenzaron a desalinearse moralmente. ¿Un argumento en pro del intelectualismo moral?

En este notebook se lee:

Al añadir gradualmente este vector a nuestro embedding original, generamos frases que mantienen el asunto, la estructura y la longitud, pero que van adquiriendo un tono cada vez más negativo.

¿Sabíais que Jonathan Swift describe algo muy parecido a los LLMs de hoy en día en los Viajes de Gulliver?

Una noticia de 2021: que “[e]l primer sistema masivo de Inteligencia Artificial de la lengua española, MarIA, empieza a resumir y generar textos”. Dios mío.

Finalmente, el artículo Inteligencia artificial, propiedad intelectual y minería de datos en Almacén de Derecho que, contra todo pronóstico, mantiene posturas razonables.

Sobre los aspectos apelativos de la causalidad

Thu, 20 Mar 2025 00:00:00 +0000

Arranco con un experimento mental: A lleva un chaleco antibalas. B le dispara, la bala atraviesa el chaleco y lo hiere de gravedad en el pecho. Varios sujetos distintos examinan lo sucedido:

La policía determina que B (y el disparo que realiza) es la causa de lo sucedido.
Los médicos que reciben a A en el hospital encuentran que la bala incrustada en su pecho es la causa de su estado.
El técnico de la empresa que fabrica los chalecos antibalas especula que el inusual calibre de la bala y el ángulo de impacto son la causa de que atravesase el chaleco.
Incluso, uno puede especular que gente que conoce a B (p.e., su siquiatra, su familia o sus amigos íntimos) aventuren otras causas para lo sucedido.

En el mundo, realmente, ha sucedido lo que ha sucedido y nada más: hay, a lo más, razones. La razón de que A se debata entre la vida y la muerte es que tiene una bala en el pecho. Pero determinados sujetos identifican causas que los apelan en tanto que son lo que son y que los mueven a la acción: unos a detener e interrogar a B, otros a intubar a B, etc.

Abunda esta entrada en algo que dejé escrito hace un tiempo: la entrada titulada Causalidad y que se convirtió en una de las más populares de este blog. En ella discutía cómo la causalidad, si acaso, está en la mente, no en el mundo. En esta se discute, además, en qué mentes y por qué motivos anida la idea de causalidad como instrumento que nos permite navegar la realidad. La causalidad nos invita —aquí resuenan ecos de aquel aforismo de Marx— a actuar sobre la realidad más que a [limitarnos a] entenderla.

Esta naturaleza apelativa de la causalidad se manifiesta frecuentemente en nuestra disciplina. A la hora de construir modelos, por ejemplo, hay distintas variables que afectan el resultado de interés. Pero algunas de esas variables no son lo que se llama accionables: si determinados clientes no son particularmente rentables porque tienen rentas bajas, no hay nada que se pueda hacer al respecto. Pero nos interesan aquellas variables sobre las que se puede actuar, aquellas que nos apelan a hacer las cosas distinto, a hacerlas mejor. Aquellas en las que tenemos agencia e, incluso, responsabilidad.

De H3, Z3 y R2 al "vibe coding" pasando por algunos asuntos más

Tue, 18 Mar 2025 00:00:00 +0000

Uber ha desarrollado H3, una retícula global de hexágonos para georeferenciar puntos y objetos. Cada hexágono tiene asociado un único ID y el sistema está concebido para poder correr de manera eficiente los algoritmos habituales: vecinos próximos, ruta más corta, etc.

OpenTimes es un sistema para mostrar el tiempo de viaje (en distintos medios) entre ubicaciones de EEUU. Tiene precalculados los miles de millones de valores de la correspondiente matriz y lo particular de la cosa es que almacena y sirve los datos desde R2, un sistema de Cloudfare similar al archiconocido S3 de Amazon pero orientado a la distribución eficiente de información para aplicaciones web.

Cada día soy más fan del Z3 SAT/SMT Solver. Estoy deseando encontrar un problema en el que poder aplicarlo (y ser pagado, obviamente, por ello).

La estrategia más efectiva para tratar de convencer a la gente que abandone el csv es obviar que el texto es el formato (prácticamente) universal.

El otro día probé monolith para empaquetar en un único fichero la web y sus dependencias de Circiter. Al fin y al cabo, el portal entero consiste esencialmente en dos landings. El resultado fueron sendos ficheros de 16 MB que nginx sirve comprimido en 5 MB y que resulta en una calificación de 100/100 en varios portales que miden la velocidad de carga. Pero me pareció una solución demasiado punk para un problema no particularmente grave.

Aquí se da cuenta de una base de datos de Postgres con más de 0.1 billones (españoles) de filas, de 16 TB de tamaño, que inserta 150k filas por segundo, corre 40k transacciones por segundo y lee 4 millones de filas por segundo. Pas mal!

files-to-prompt concatena una serie de ficheros y los convierte en un prompt para pasárselos a un LLM.

Era moda acudir a StackOverflow a ver cómo progresaba la popularidad de los diversos lenguajes de programación. Ahora las cosas tienen esta pinta:

La fuente es esta y la fecha relevante en el gráfico coincide con…

Un tutorial moderno de web scraping. La tecnología siempre cambia y uno encuentra a veces métodos de lo más extraño para servir la información. Fracasé varias veces en el intento de descargar la actualización de la lista de los ETFs de ING hasta que me di cuenta que en la nueva versión, la información venía en un objeto de Javascript puro dentro de un fichero .js.

Construction Physics (un blog muy recomendable) trae una entrada sobre la energía solar en la que argumenta alrededor de una serie de cálculos y simulaciones. Al parecer, el autor ha colgado el código en GitHub y ha advertido que lo escribió a golpe de vibe.

Más sobre el vibe coding (sistematizado, profesionalizado), aquí.