Datanalytics

Archivo

Entradas Etiquetadas ‘rapidminer’

Tutorial: instalación de la extensión de R para RapidMiner

Viernes, 22 de octubre de 2010 8 comentarios

Por popular demanda, voy a explorar cómo de dificultoso es instalar el puente entre R y RapidMiner en Windows y a dejar escrito cómo se hace. Lo instalé hace días en Linux (Ubuntu) sin mayor problema. Pero hay quien parece que haberlos tenido en la ubicua plataforma.

No sé mucho de Windows y las diferentes versiones y configuraciones que pueda tener. Sólo sé que que he probado los pasos de este tutorial sobre un Windows 7 Profesional (creo) de 32 bits.

Los pasos son los siguientes:

  1. Descargar RapidMiner de esta página e instalarlo a la Windows: doble click, aceptar, aceptar, etc.
  2. Tal vez mientras tanto, instalar R y el paquete rJava (de no tener alguno de los dos instalados ya previamente).
  3. Añadir el directorio en el que se encuentran R y R.dll a la variable de entorno %PATH% de Windows para que RapidMiner pueda encontrarlos. En mi instalación son dos directorios distintos: C:/archivos de programa/r/r-2.12.0/bin para R y C:/archivos de programa/r/r-2.12.0/bin/i386 para R.dll.
  4. Tener adecuadamente instalado Java en el ordenador. En particular, tener definida la variable de entorno JAVA_HOME apuntando al directorio que contenga un JRE. Es más que probable que sea necesario uno no demasiado antiguo. En mi sistema he usado éste que está en C:/archivos de programa/java/jre6. Hay otro en el directorio de instalación de RapidMiner que también debería funcionar.
  5. Arrancar RapidMiner. Al iniciarse por primera vez, RapidMiner nos pregunta por el directorio donde ubicar el repositorio. Se puede crear uno para él. Inmediatamente se abre una ventana en la que RapidMiner indica que existen actualizaciones disponibles. Como se aprecia en la captura de pantalla, una de ellas es la extensión para R (imagino que quienes tengan ya instalado RapidMiner pueden acceder a la misma ventana de actualizaciones a través de los menús de la aplicación):

  6. Tras seleccionar la extensión para R y confirmar la selección, aparece una ventana con instrucciones adicionales que se refieren, fundamentalmente, a Java (aunque realmente ya hemos hecho todo eso antes).
  7. Reiniciar Rapidminer. Entonces éste pregunta por la ubicación del fichero jri.dll, que se encuentra dentro de la carpeta del paquete rJava de R. En particular, en mi sistema, está en C:/archivos de programa/r/r-2.12.0/library/rJava/jri.
  8. Reininciar RapidMiner,… et voilà:

Categories: r Tags: ,

Liberado KNIME 2.2.2

Jueves, 30 de septiembre de 2010 Sin comentarios

Ha sido liberada la versión 2.2.2 de KNIME. De esta plataforma de minería de datos hablé hace un año en las I Jornadas de R en Murcia (puede verse aquí el vídeo de la conferencia). Me interesó mucho desde un principio porque fue de las pioneras en ofrecer una integración con R y porque permitía desarrollar de una manera sencilla módulos adicionales.

Es de esperar que R, KNIME, Rapidminer (del que también he hablado recientemente) y otras iniciativas emergentes se conviertan en una realidad cotidiana en el mundo de la empresa.

Categories: minería de datos Tags: ,

Más sobre la integración de R y RapidMiner

Miércoles, 8 de septiembre de 2010 4 comentarios

Si el otro día anuncié la próxima integración de RapidMiner con R, hoy quiero dar a conocer un vídeo en la que se ilustra:

Tiene buena pinta, la verdad.

Anuncio de la integración de Rapidminer y R

Martes, 31 de agosto de 2010 7 comentarios

RapidMiner es, posiblemente, la plataforma de minería de datos libre que mejor reputación goza. Hasta la publicación de la versión 5 le veía un pequeño problema: tenía una interfaz bastante poco intuitiva.

Hasta hace pocos días le veía otro: no podía extenderse —al menos de una manera obvia— programando en Java o, preferiblemente, R. Sin embargo, el módulo de integración de R con Rapidminer ya está listo y su lanzamiento va a ser el plato fuerte de RCOMM 2010, la conferencia de usuarios de Rapidminer (oficialmente, RapidMiner Community Meeting And Conference).

Estaremos muy atentos a ver qué da de sí esta integración tan esperada (de algunos, claro).