RDataMining, un paquete para minería de datos con R

Comparto con mis lectores la noticia que he recibido del paquete (aún en ciernes) RDataMining. El objetivo de sus promotores es construirlo colaborativamente (¡se buscan programadores!) e incluir en él algoritmos publicados que no tengan todavía implementación en R.

Existen en R muchos paquetes útiles para la minería de datos. De todos ellos, me atrevería a recomendar el paquete caret que, más allá de integrar diversos algoritmos, incluye funciones auxiliares útiles para seleccionar modelos, comparar la importancia de funciones, realizar validaciones cruzadas, etc. utilizando una sintaxis coherente y homogénea. Que es algo a lo que los autores de las APIs de los distintos paquetes prestan poca atención, desafortunadamente.

El objetivo del nuevo paquete es acelerar el proceso de incorporación de los avances teóricos en el campo de la minería de datos en R. Porque muchos algoritmos publicados no incluyen implementación o, de hacerlo, se implementa en otros lenguajes de programación.

Y recuerda: ¡estás invitado a participar en el desarrollo del paquete!