plyr, dplyr, data.table: ¿qué opinas?

Fui un pájaro mañanero con plyr.

Probé una vez data.table y no me convenció. Volví a él cuando realmente lo necesitaba y ahora es la prolongación de mis dedos.

Aún no me he puesto con dplyr aunque he visto el suficiente código escrito con él que no creo que me cueste mucho comenzar a usarlo.

Pero tengo la sensación de que tenemos un cisma como el de vi contra emacs en ciernes. Comienza a haber, parece, partidarios acérrimos de tirios y troyanos. Así que abro la sección de comentarios para que opines sobre estos paquetes. A mí y a muchos otros lectores nos gustaría conocer tu opinión al respecto. ¿Cuál utilizas? ¿Qué te gusta de cada cual? ¿Cuál recomendarías?

Un comentario sobre “plyr, dplyr, data.table: ¿qué opinas?

  1. Jesus 24 septiembre, 2014 12:31

    Hola,
    el origen principal de este pequeña «escalada de tensión», creo que viene alimentada por los dos autores.
    Las puyitas en twitter entre ellos ( y alguno de los principales contribuyentes a cada proyecto) son habituales. La última ha sido una pregunta que le hace directamente Matt Dowle a Hadley Wickham sobre la razón de duplicar el esfuerzo del desarrollo la función fread de data.table en ddplyr (otra función para leer rapidamente ficheros de texto ‘ fastread’).

    Aparte de las excelentes comparativas que se encargan de ofrecer a sus posibles clientes para conseguir más adeptos.

    Diré lo que me parece mejor sobre cada paquete:

    Data.table: Máxima velocidad. Lectura del código más sencilla en las tareas triviales y razonable en las estructuras más complejas.
    ddplyr: Acceso a bases de datos unificado.

    Un saludo
    Jesús

Los comentarios están desabilitados.