Una transformación (y segmentación) novedosa de variables (lognormaloides)

— La variable gasto tiene una distribución muy fea que tiene un impacto en el modelo. He optado por transformarla.
— ¿Qué has hecho?
— Bueno, verás: no es lo mismo que alguien gaste menos de un euro o que gaste más de cien. A los que gastan entre cero y uno les he dado el valor 0.
— Vale.
— Entonces, a los que gastan, digamos, entre 1 y 10, 1; luego, a los que gastan entre 10 y 100, 2. Porque no es lo mismo gastar 9 que 90, ¿no?
— Claro.
— Y así sucesivamente… a los que gastan entre 100 y 1000 euros, les he puesto un 3…
— Para, para, para… ¡has tomado el logaritmo!
— Eh, bueno, en realidad… log10(x+1)

Resumen:

  • ¡Los arbitrios que tiene que hacer uno para que le dejen tomar logaritmos!
  • No trates de venderle la moto a alguien que tiene un doctorado… aunque sea en informática.

Concluyo con una cita de Andrew Gelman:

“You take the log so fast that you don’t even see the actual data. Plus you take the log because you can, because they’re all positive.”