El IVA y las exportaciones

Los viernes me concedo ciertas libertades Como la de escribir sobre temas distintos de los habituales. Hoy toca economía. Quiero dejar escrito algo que echa por tierra cosas que creía. Es decir, cosas que había leído, me habían parecido razonables y había dado por buenas sin más.

Crudamente, sin mayores distingos, ¿fomenta las exportaciones el (o una subida del) IVA? Había leído que sí en sitios como Nada Es Gratis,

La subida del IVA aumentaría el precio de las importaciones, sin modificar al precio de las exportaciones, pues los exportadores están exentos de facturar el IVA y tienen derecho a la devolución de lo soportado.

Dos técnicas fundamentales para gráficos dinámicos de datos: "linking" y "brushing"

El otro día me tocó enseñar algo de lo que no sé mucho: gráficos interactivos con R. Hay muchos paquetes que vienen a hacer más o menos lo mismo. Es tentador limitarse a eso, a exponerlas. O más bien, a exponer unas vías de entrada, a establecer unas cabezas de playa desde las cuales el interesado pueda avanzar autónomamente.

Tanto (tentador) que uno pasa por alto la razón de ser misma de querer incorporar interactividad a los gráficos. Por el camino, dos técnicas fundamentales y muy útiles para tal fin: linking y brushing.

El RMSE es Dios y XGBoost, su profeta

De los últimos foros de científicos de datos a los que he asistido, de las últimas conversaciones con científicos de datos que he mantenido, he salido con una gran duda: ¿soy yo el que tiende a juntarse con ellos o es que hay una plaga de talibanes del RMSE es Dios y XGBoost, su profeta?

herejes_hoguera

Lejos está ese lema simplificador de los principios que me mueven a escribir estas páginas. Por lo que, anuncio, estoy arrejuntando razones y papelotes con los que tratar de arrancar un movimiento herético.

Que hagan lo que quieran en Plaza de España; yo, la verdad, no tengo tiempo para leer 350 MB de documentación

Ha salido lo de la votación de plaza de España. Un festival para la democracia.

Yo, de hecho, ya voté en la primera ronda. Voté que la dejasen como está. Por un motivo muy simple: cada vez que camino por las calles próximas a mi casa, como haya llovido no hace tanto y tenga mala suerte, piso en una de esas baldosas mal fijadas que proyectan alevosos chorros de agua putrafacta por la pierna p’arriba. Porque en la intersección de dos calles por las que paso siempre, cuando llueve, se forma una balsa de agua a la que solo faltan ranas. Porque los contenedores en los que reciclo están cercados de montañas de residuos de todo tipo. Porque, creo, que antes de invertir más (y particularmente, antes de invertir a un kilómetro de mi casa) deberían devolverse a un estado digno las infraestructuras municipales por las que transito a diario. Por eso, insisto, me opuse.

Barómetros del CIS con R

El CIS realiza barómetros todos los meses menos uno. Pasado un tiempo (es octubre y el último publicado es de julio) coloca los microdatos en su banco de datos.

Aparte de ficheros .pdf que lo explican todo (pero que no dejan de ser .pdf), publica dos ficheros. Uno de datos en ancho fijo (prefijo DA) y otro con código SPSS (prefijo ES) con los consabidos (¿lo son? ¡felicidades si no!) encabezados DATA LIST, VARIABLE LABELS, VALUE LABELS, y MISSING VALUES.

Si se estudió que las autopistas eran viables, ¿por qué están ahora en quiebra?

Así titula El Mundo un artículo en el que el mismo periódico se responde:

Porque los estudios de viabilidad sirvieron más para justificar la construcción que para cubrir una necesidad real. La R-3 y la R-5 absorberían 70.000 vehículos diarios según las estimaciones y el tráfico real es al menos cuatro veces inferior. En sentido contrario Gobierno, concesionarias y bancos subestimaron el coste del suelo. Los expropiados llevaron su caso a los tribunales y llegaron a multiplicar hasta en 10 veces lo que recibieron años atrás.

Una jerarquía de analistas de datos en cuatro escalafones

Es:

  • Nivel 1: Realizan la mayor parte de su trabajo con herramientas ofimáticas (fundamentalmente Excel), aunque pueden utilizar puntualmente Eviews, Stata, R o Matlab.
  • Nivel 2: Los que realizan la mayor parte de su trabajo con R, Python, SAS o SQL pero cuyo sistema de control de versiones es el de ficheros con determinadas convenciones de nombres.
  • Nivel 3: Como el anterior, pero usando control de versiones, estilos de código, y revisión por pares (peer review).
  • Nivel 4: Como el anterior, pero incorporando métodos propios de la ingeniería de software como el unit testing, documentación integrada, release cycles, etc.

Lo anterior está traducido de Why you need version control, que habla de eso y más. Léelo.

Sobre ciencia de datos en UNIR: teoría y gente

Hoy (jueves) he participado en un desayuno de trabajo organizado en la UNIR como pistoletazo de salida a un curso de inteligencia artificial en el que tendré una pequeña participación.

Nos ha tocado presentarnos a todos (había gente de Telefónica, Santander, Mapfre, Siemens, etc.) y según avanzaba la ronda han ido superándose peligrosamente las dosis máximas diarias establecidas por la OMS para la el impacto auditivo de palabras tales como disruptivo, futuro, innovación, coche autónomo, fabuloso y nosotros.