dbf · xlsx · pdf

Me escriben pidiendo consejo sobre cómo leer datos contenidos en (una serie larga de) ficheros en formatos .dbf, .xlsx (con un formato extraño) y .pdf.

.dbf

No tengo ni curiosidad por averiguar de dónde proceden. Simplemente,

funciona de maravilla.

.xlsx

Estos sí que sé de dónde vienen (y me guardo la opinión). El problema aquí no era leer directamente tablas contenidas en hojas sino ir extrayendo celdas y rangos de hojas. Así que:

.pdf

Un gran depende. Puede ser muchas cosas (entre peores y pésimas, por supuesto). Pero hablan bien del paquete tabulizer de R. A saber.

Un comentario sobre “dbf · xlsx · pdf

  1. Jose Luis Cañadas Reche 26 noviembre, 2017 15:30

    Lo de los dbf (dbase files) es curioso, es un formato que se sigue usando, por ejemplo los shapefiles guardan la info de sus atributos en un dbf.

Comenta

Your email address will not be published.

Puedes usar estas etiquetas y atributos de HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">