Mala Ciencia

Es imposible enseñar nada a alguien cuyo sueldo depende de no aprender

O algo así reza una cita que no ubico. Viene a cuento de un artículo que se acaba de publicar en Nature, A manifesto for reproducible science, que se resume así: Los científicos son gente extraordinaria que persigue honrada y abnegadamente el ensanchamiento del saber humano. No obstante, están produciendo toneladas de mierda. Pero no lo hacen consciente o malintencionadamente; lo hacen porque no saben. Si se equivocan, además, es por culpa de la sociedad, que los incentiva torcidamente.

Claroscuros que, obviamente, pasan inadvertidos

Entre tanto óbito farandulero en las postrimerías del año que se fue (¿dónde quedó el pobre de Eco?) ha pasado medio desapercibido otro sustancialmente más interesante: el del doctor Henry Heimlich. De sus claros, ya habla la prensa (aquí y aquí). Pero bastaba con pasearse por la Wikipedia para desenterrar algunos de sus oscuros: homeopatía, malarioterapia (una seudopráctica científica consistente en infectar a un paciente con malaria por ver si esta le cura el cáncer, el sida y demás) y denuncias generalizadas de prácticas anticientíficas y deshonestas.

El RMSE es Dios y XGBoost, su profeta

De los últimos foros de científicos de datos a los que he asistido, de las últimas conversaciones con científicos de datos que he mantenido, he salido con una gran duda: ¿soy yo el que tiende a juntarse con ellos o es que hay una plaga de talibanes del RMSE es Dios y XGBoost, su profeta? Lejos está ese lema simplificador de los principios que me mueven a escribir estas páginas. Por lo que, anuncio, estoy arrejuntando razones y papelotes con los que tratar de arrancar un movimiento herético.

Lotería y elecciones: se non è vero...

Incumbent politicians tend to receive more votes when economic conditions are good. In this paper we explore the source of this correlation, exploiting the exceptional evidence provided by the Spanish Christmas Lottery. Because winning tickets are typically sold by one lottery outlet, winners tend to be geographically clustered. This allows us to study the impact of exogenous good economic conditions on voting behavior. We find that incumbents receive significantly more votes in winning provinces.

La ciencia: dos puntos de vista

La escala de grises media entre un blanco y un negro, las dos posturas frecuentemente identificables que expongo. Postura uno: ciencia como fin en sí mismo. Los científicos reclaman a través de un bucle burocrático recursos a las clases productivas. Si alguien levanta la ceja alegan eso de que sin ciencia no hay futuro y de preguntárseles por evidencias del impacto social de su quehacer responden, a lo más, con evidencia anecdótica.

Reescrituras interesadas (de resultados estadísticos más o menos conocidos)

Traigo hoy dos artículos interesantes sobre un mismo tema: la ciencia de datos reescribiendo de manera interesada resultados estadísticos más o menos conocidos, presentando como nuevos los que no lo son del todo y omitiendo interesadamente referecias bibliográficas. Son este y este (aunque el segundo trata de más temas). Es muy interesante el concepto de plagio inteligente en oposición al de plagio literal que denuncia el primer enlace.

Ayer me puse el sombrero negro

Ayer tuve una visita: un amigo me pidió que le echara una mano a otro que andaba muy perdido con su tesis de máster. No era estadístico pero estaba construyendo regresiones y pruebas de hipótesis y no entendía los resultados. Como a veces pasa, había comenzado por las conclusiones (tal vez razonables) con la esperanza de que los datos acabasen dándole la razón. Y se la daban… salvo por un pequeño detalle: aunque significativo, el coeficiente de la corrupción tenía el signo contrario.

Respuestas distintas, ¿a la misma pregunta?

Hará ya un par de años, un señor muy importante divulgaba en su bitácora los resultados de un estudio relativo a la educación en España que acababa de publicar. Dedicaba una pequeña parte de la entrada a cuestiones metodológicas y el resto a cuestiones normativas: dado que he encontrado esto y aquello con un p-valor de tal, no otro remedio queda que aplicar todas estas medidas que aquí enumero, era el resumen de todo.

Dos análisis y una pregunta

El primero: Crece la productividad: Para el conjunto del año 2015 la economía crecerá cerca del 3,5% Estos datos muestran que está aumentando la productividad, es decir, mientras la economía española crece a ritmos cercanos al 3,5% anual el empleo lo está haciendo al 3%. Rafael Pampillón Olmedo. Expansión, 24 de julio de 2015 (enlace) El segundo: La productividad se estanca: Tal como publicó el INE este jueves en tasa anual durante el segundo trimestre de este año, la economía creció un 3,1%.

¿Si un día faltan 21.63 euros en caja?

Si un día faltan 21.63 euros en caja se cuenta y se recuenta. Se revisan los tiques, se comprueban los pagos con tarjeta, se vuelven a sumar los pagos a proveedores, etc. Hasta que, con suerte, alguien encuentra algo y la diferencia se reduce a, digamos, 3.92 euros. Pero cuando la diferencia es de 2.15… se da por buena sin más. Cuando el t-test da un p-valor de .058, se revisan los números, se reestudia la carga y manipulación de datos, se replantea si el caso 194 es o no un outlier, etc.

Tres sigmas o nanay

El otro día hablaba con una colega sobre una charla a la que habíamos asistido. Yo le decía que sí, que estaba bien, pero que todo lo que habían contado era mentira. Debí haber sido más preciso y decir que no era verdad, que es distinto. Pero las canapescas circunstancias no eran propicias para el distingo. Mi interlocutora me escuchaba, pienso, entre sorprendida e incrédula. Todavía está en la edad en la que hay que creérselo todo —sí, esa edad y esa obligación existe— y tiempo tendrá de dejarse envenenar por el nihilismo.

Tirar la piedra, esconder la mano

Hoy he encontrado esto en Twitter: Míralo bien. Vuelve a mirarlo. Efectivamente, los ricos votaron en contra de la independencia; los pobres, a favor. ¿Verdad? Muchos, yo incluido, estamos inclinados a pensarlo así. Los resultados de una pequeña muestra que he hecho en la oficina han sido contundentes: todos, a pesar de sus doctorados, han estado de acuerdo unánimemente con el juicio anterior. Así que ha sucedido lo siguiente: Así que a pesar de toda mi cautela, de ese podría condicional, he tenido que asumir que, efectivamente, el autor de ese gráfico está enteramente libre del pecado de falacia.

Sólo el 5% ganan dinero con el "análisis técnico"

Hojeando la prensa francesa di con este pequeño artículo en Les Echos, Pourquoi les particuliers sont perdants sur les devises. Remite a un artículo reciente, Is Technical Analysis Profitable for Individual Currency Traders? inasequible para quienes creemos que los 45 dólares que cuesta descargarlo tienen mejor empleo en otra parte (es curioso: en muchos otros ámbitos académicos es fácil conseguir los artículos gratis; en finanzas, casi imposible). ¿El resumen? Que prácticamente nadie gana dinero usando el llamado análisis técnico.