Discretización de variables continuas (con árboles)

2016-4-25 (Última modificación: 2016-4-25)

La primera entrada de esta bitácora es de enero de 2010. En aquella época, recuerdo, había apartado un artículo sobre categorización de variables continuas, i.e., el proceso de convertir (¿para qué?) una variable continua en categórica de una manera óptima.

Aparte de cuestionar el paraqué (¿por qué porqué es sustantivo y paraqué no?) de la cosa me asaltaron dudas sobre el cómo. Si se quiere discretizar, ¿por qué no usar directamente un árbol? Es decir, un árbol simple en el que se modele la variable objetivo en función de la continua que se desee discretizar.

Y esa es la entrada que nunca escribí en su día. Y ahora llego tarde porque alguien ya lo ha hecho por mí.

(Gracias se le deben a Gema Mora, exalumna de mi curso de R en KSchool, que me ha pasado la nota; me alegro mucho de verla activa en estos menesteres).

Addenda: atención al tercer punto de esto.