Los «mejores» paquetes de R (II): análisis anual de la red social de los participantes en r-help

Hace un tiempo comencé una serie de entradas, que serán finalmente tres, sobre los «mejores» paquetes de R. Esta va a ser la segunda entrega. Siento haber tardado tanto en realizarla: quienes me conocen saben que ocioso no he permanecido. De mis actividades de este periodo daré cumplida cuenta en entradas subsiguientes.

Tengo que añadir también como preámbulo que ha sido una conversación sobre análisis de redes sociales con un ex-compañero muy ducho en apropiarse de contraseñas ajenas la que me ha empujado finalmente a ahondar este estudio que tenía, junto a tantos, postergado en una esquina de mi disco duro.

En la primera entrada hice un ránking de los participantes más activos en la lista de correo r-help mediante técnicas análogas a las que usa Google para asignar pesos —o pageranks— a páginas. En ésta voy a analizar la evolución de estos pesos año a año.

En primer lugar, ahí va el número de personas que han respondido correos en la la lista en cada año (nótese que el 2010 está truncado en abril):

Luego, una vez calculados los pesos de cada una de ellas, muestro el podio en cada uno de los años:

año
1
2
3
1997 wvenable ihaka thomas
1998 p.dalgaard wsimpson bates
1999 p.dalgaard ripley maechler
2000 ripley p.dalgaard gb
2001 ripley p.dalgaard alobo
2002 ripley p.dalgaard tlumley
2003 ripley p.dalgaard spencer.graves
2004 p.dalgaard ripley ggrothendieck
2005 ripley p.dalgaard ggrothendieck
2006 ggrothendieck ripley murdoch
2007 ggrothendieck ripley murdoch
2008 ggrothendieck h.wickham ripley
2009 ggrothendieck waclaw.marcin.kusnierczyk dwinsemius
2010 ggrothendieck murdoch dwinsemius

Es constatable cómo Ripley, »campeón absoluto» de manera global, parece haberse alejado de r-help (aunque sigue muy activo en la más elitista r-devel). También cómo Venables e Ihaka, pioneros en el mundo de R, dejaron pronto paso a otros entusiastas del lenguaje.

El único español que ha ocupado los lugares de privilegio es alobo, al que no conozco, pero que usaba una cuenta del CSIC a primeros de siglo.

Finalmente, presento una gráfica que muestra la evolución histórica del peso agregado de los respondedores por decil: se aprecia un claro proceso de concentración: una élite de expertos en R —creciente también en número, todo hay que decirlo— está concentrando a los líderes (en la terminología utilizada por los expertos en redes sociales) de la lista de correo de R.

(Los lectores más inquietos habrán advertido cómo ciertas series se cortan cuando no lo debieran en el gráfico anterior. Se trata de un artefacto causado por empates en pesos.)