Anuncio de la integración de Rapidminer y R

RapidMiner es, posiblemente, la plataforma de minería de datos libre que mejor reputación goza. Hasta la publicación de la versión 5 le veía un pequeño problema: tenía una interfaz bastante poco intuitiva.

Hasta hace pocos días le veía otro: no podía extenderse —al menos de una manera obvia— programando en Java o, preferiblemente, R. Sin embargo, el módulo de integración de R con Rapidminer ya está listo y su lanzamiento va a ser el plato fuerte de RCOMM 2010, la conferencia de usuarios de Rapidminer (oficialmente, RapidMiner Community Meeting And Conference).

Estaremos muy atentos a ver qué da de sí esta integración tan esperada (de algunos, claro).

8 comentarios sobre “Anuncio de la integración de Rapidminer y R

  1. ffernandez 1 septiembre, 2010 16:10

    Muy interesante, hasta ahora esa era la mayor desventaja que le veía frente a Knime, habrá que estar atentos…

  2. Garçon 1 septiembre, 2010 22:20

    Quería consultarte si tienes algún comentario sobre Weka…
    …digo porque dices que RapidMiner tiene la mejor reputación

  3. datanalytics 1 septiembre, 2010 22:29

    Hace un tiempo que no toco Weka, pero creo que la diferencia principal entre Weka y Knime o RapidMiner es que los dos últimos están más enfocados a aplicaciones profesionales: tienen más trabajadas la conexión con base de datos, herramientas de automatización de informes, etc.

    Además, aunque esto puede que haya cambiado últimamente, Weka tenía más problemas de memoria que los otros paquetes. Tal vez por la misma concepción de unos y otros: académica o «profesional».

    Por lo demás, todo va en gustos. Yo, personalmente, preferiría una plataforma desarrollada en Python que funcionase mejor que Orange, por ejemplo… pero no la hay.

  4. Garçon 1 septiembre, 2010 22:54

    @datanalytics
    Gracias por tu respuesta!

  5. Manuel 6 septiembre, 2010 8:50

    Muy interesante tu blog.

    Estoy «dándole vueltas» a herramientras libres de Datamining, entre las que aparece Rattle.

    ¿Alguna opinión sobre esta última?

    Un saludo,

  6. datanalytics 6 septiembre, 2010 19:38

    Hay tantas herramientas de ese tipo (y las horas del día pasan tan rápido) que no puedo probarlas todas como debiera para emitir juicios con criterio.

    Rattle… lo probé hace un tiempo. Me pareció un interfaz directo a R (y paquetes de R). Por eso no le vi grandes ventajas: si hay que trabajar con R, puedo programar directamente y no necesito un interfaz.

    Te confieso que no me gustan estas herramientas «per se». Si todo el mundo fuese como yo, no existirían: todos programaríamos nuestros procesos a la vieja usanza. Me interesan herramientas que permiten delegar tareas en personas que no programan pero que pueden gráficamente acceder a una base de datos, realizar ciertas manipulaciones de datos, etc. Y luego, que estas herramientas puedan extenderse (con R, por ejemplo) con componentes que encierren algo de lógica interesante.

    Rapidminer tenía buena reputación (véanse las encuestas de KDNuggets), pero me parecía limitada: oros, copas, espadas, bastos y nada más. Si ahora se puede combinar con R (u otras herramientas) se abren muchas posibilidades. Incluso de negocio: crear nodos ad hoc para usos específicos de clientes concretos, por ejemplo.

  7. Manuel 9 septiembre, 2010 15:19

    @datanalytics
    Gracias por la opinión.

Los comentarios están desabilitados.