Requisitos para mi taller de Hadoop + R en las V Jornadas de Usuarios de R

El jueves 12 de diciembre impartiré un taller titulado Big data analytics: R + Hadoop en las V Jornadas de Usuarios de R.

Va a ser un taller práctico y eso exige de los asistentes que quieran aprovecharlo disponer de una plataforma (¡no trivial!) sobre la que seguirlo y poder realizar los ejercicios. Además de poder seguir ahondando en el asunto después y por su cuenta.

Los requisitos son los siguientes:

Software:

Nótese que el tamaño de la máquina virtual (3GB) y del resto de los componentes hace imposible descargar todo el software necesario el día de las jornadas. Hay que descargarlo de antemano.

Hardware:

  • 4GB de RAM como mínimo; recomendado, +8GB
  • Ordenador / OS de 64 bits

Instrucciones:

  • Descarga la versión de VirtualBox (el enlace está arriba) adecuada para tu OS e instálalo.
  • Descarga la máquina virtual y descomprírmela
  • Abre VirtualBox y luego, Machine > Add (el fichero descomprimido)
  • Arranca la máquina virtual (y comprueba que lo hace).
  • De ocurrir algún problema:
    •  Comprueba la lista de errores conocidos (más abajo).
    • Busca el error en Google y soluciónalo.
    •  Escríbeme con una descripción del problema.

Acceso a la máquina virtual:

ssh: ssh -oPort=2222 rhadoop@localhost # pwd:rhadoop

root: pwd:hadoop

web:

  • rstudio:
    • http://localhost:8787
    • u/p: rhadoop/rhadoop
  • hadoop job tracker:
    • http://localhost:50030

Problemas conocidos:

La máquina virtual podría no arrancar (error de tipo VMR*) si tienes desactivada la virtualización en la BIOS. Los detalles de cómo solucionar el problema dependen de la máquina pero no es complicado identificar la opción que permite activar la virtualización.

12 comentarios sobre “Requisitos para mi taller de Hadoop + R en las V Jornadas de Usuarios de R

  1. Ayuso 2 diciembre, 2013 9:56

    Es la misma que colgaste en el congreso de Big Data Spain o hay alguna modificación?
    (Así evito la descarga)

    Un saludo y gracias!

  2. datanalytics 2 diciembre, 2013 11:27

    Te valdría el anterior casi al 100%. Tiene alguna pequeña modificación pero solo en partes (y no grandes) del código.

  3. Ayuso 2 diciembre, 2013 12:10

    Ok, gracias!

  4. Enrique Gabriel Baquela 4 diciembre, 2013 18:07

    ¿Vas a dejar los scripts/presentaciones en algún lado?, para consultarlas los que no podamos ir.
    ¡¡¡Saludos!!!

  5. Cristian Rojas 18 diciembre, 2013 18:50

    Que buen material, hace mucho buscaba una máquina virtual con Hadoop funcionando. No soy fan de Linux, pero la verdad es que al menos pude hacerla funcionar. Una proegunta, existirán scripts de ejemplo, que podamos probar en la MV?. Muy agradecido.

  6. Javier 7 enero, 2014 18:03

    Hola,

    muchas gracias por el material, están disponible los scripts o la presentación para consultarlos?

    Gracias y saludos,

    Javier

  7. David Ibarra 9 abril, 2014 11:56

    ¿Se ha roto el enlace hortonworks_sandbox_rstudio.zip?

    Hay otro enlace?

  8. Carlos J. Gil Bellosta 9 abril, 2014 14:26

    Lo quité porque es demasiado grande (varios gigas). Si lo necesitas, escríbeme y miro a ver cómo puedo hacértelo llegar.

  9. Carlos J. Gil Bellosta 9 abril, 2014 17:11

    Lo que pasa es que sobre esa versión hay que instalar herramientas adicionales (R, ciertos paquetes, etc.). Igual en lugar de dar un enlace me pongo un día –si encuentro el tiempo– y armo un tutorial sobre los requisitos, etc. Así no caducaría.

  10. José Antonio González 14 junio, 2014 19:00

    Hola Carlos, soy uno de los participantes de las jornadas de Genaeio en Madrid del 16 y 17 de junio. Te escribo porque he tratado de seguir tus instrucciones para instalar la VM pero no lo he conseguido. Además, cada uno de los intentos ha dado lugar a un error distinto. Me llevo la VM en un DVD y tengo instalado VirtualBox, por si acaso, pero la duda está en si mi portatil reune los requisitos necesarios. Bien, nos vemos ahí. Un saludo.

  11. Carlos J. Gil Bellosta 15 junio, 2014 12:12

    Raro… Nadie ha conseguido jamás instalarlo a la primera; pero tampoco a nadie se le ha resistido más allá de la tercera. ¿Qué tipo de error te da?

Los comentarios están desabilitados.