Una transformación (y segmentación) novedosa de variables (lognormaloides)

2014-9-17 (Última modificación: 2014-9-17)

– La variable gasto tiene una distribución muy fea que tiene un impacto en el modelo. He optado por transformarla. – ¿Qué has hecho? – Bueno, verás: no es lo mismo que alguien gaste menos de un euro o que gaste más de cien. A los que gastan entre cero y uno les he dado el valor 0. – Vale. – Entonces, a los que gastan, digamos, entre 1 y 10, 1; luego, a los que gastan entre 10 y 100, 2. Porque no es lo mismo gastar 9 que 90, ¿no? – Claro. – Y así sucesivamente… a los que gastan entre 100 y 1000 euros, les he puesto un 3… – Para, para, para… ¡has tomado el logaritmo! – Eh, bueno, en realidad… log10(x+1)…

Resumen:

¡Los arbitrios que tiene que hacer uno para que le dejen tomar logaritmos!
No trates de venderle la moto a alguien que tiene un doctorado… aunque sea en informática.

Concluyo con una cita de Andrew Gelman:

“You take the log so fast that you don’t even see the actual data. Plus you take the log because you can, because they’re all positive.”