Descargar ficheros .gz detrás de HTTPS con R

El problema consiste en leer, por ejemplo, https://stat.ethz.ch/pipermail/r-help-es/2012-August.txt.gz.

Desde Windows, por algún motivo, es sencillo: se puede usar download.file y luego, readLines directamente (porque no sé si sabéis que esta y otras funciones similares saben leer directamente ficheros comprimidos con gzip).

En Linux parece algo más complicado: download.file se niega a bajar ficheros usando el protocolo https. Lo mejor que he sabido hacer es

library(httr)
x <- GET("https://stat.ethz.ch/pipermail/r-help-es/2012-August.txt.gz")
tmp <- tempfile()
writeBin(content(x, "raw"), tmp)
res <- readLines(tmp)
unlink(tmp)

que es feo, feo, feo.

2 comentarios sobre “Descargar ficheros .gz detrás de HTTPS con R

  1. Jorge 12 noviembre, 2014 10:22

    Te me has adelantado… Yo suelo usar method=»curl»

    ¡Saludos!

Los comentarios están desabilitados.