Estrategias escalables con R

Recomiendo leer Scalable Strategies for Computing with Massive Data, un artículo que trata dos de los problemas de escalabilidad con que tropezamos los usuarios de R:

  • Los de memoria, para los que proponen e ilustran el uso del paquete bigmemory.
  • Los de velocidad de ejecución, a los que se enfrentan paralelizando el código, tanto en una única máquina como en un clúster, con foreach.

En el artículo no solo discute los dos paquetes por separado sino que ilustra, además, cómo usarlos conjuntamente en su propuesta de estrategia escalable con R.

Un comentario sobre “Estrategias escalables con R

  1. jbm 28 julio, 2015 12:03

    Por desgracia, a nuestro chiquitín es un niño maravilloso, pero lo de escalable es más peliagudo. Bigmemory requiere algún adiestramiento. Y foreach está bien si el algoritmo que paraleliza es rápido. ¿Has probado randomForest en R? Me he pasado al h2o.

Los comentarios están desabilitados.