Datanalytics

Minería de Datos

El de la minería de datos constituye nuestro principal campo de especialización. Nuestra experiencia en el campo de la minería de datos se extiende tanto al área académica como a la empresarial.

Áreas de experiencia

Dentro del área de la minería de datos, hemos trabajado en distintos tipos de proyectos:

  • Aplicaciones clásicas de márketing: fugas, ventas cruzadas, segmentación, etc.
  • Detección del fraude en empresas de telecomunicaciones.
  • Desarrollo de algoritmos para la selección automática de variables relevantes

Proyectos

Uno de nuestros proyectos más ambiciosos dentro del ámbito de la minería de datos es el de desarrollar una solución flexible que permita la implantación de servidores analíticos de minería de datos. Éstos serían muy útiles en empresas donde:

  • Hay que realizar reiteradamente un el mismo tipo de análisis sobre datos distintos.
  • Dichos análisis los realizan usuarios distintos sobre máquinas distintas y, a veces, desde ubicaciones remotas.
  • Estos análisis exigen un hardware potente, que excede el de los habituales puestos de sobremesa.

La solución más adecuada para este tipo de empresas sería la de instalar un servidor analítico potente que pudiera atender de manera centralizada y a través de un interfaz cómodo las peticiones de los usuarios, independientemente de su ubicación física, etc. Las ventajas de dicha solución son evidentes: un ahorro en hardware, en licencias, en mantenimiento; una gestión menos caótica de los procesos de minería de datos; menores costes de capacitación, etc.

Recursos

Queremos recoger en la siguiente lista de enlaces una serie de recursos que nos han resultado útiles en el desempeño de nuestras actividades.

  • Libros
    • T. Hastie, R. Tibshirani, J. Friedman "The elements of Statistical Learning: Data Mining, Inference, and Prediction". Durante la última década ha habido un desarrollo sin precedentes en el campo de la estadística, la minería de datos, el aprendizaje automático y la bioinformática. Muchos de ellos están construidos sobre bases conceptuales similares, pero expresadas con una terminología heterogénea. Este libro describe las ideas más importantes en dichas áreas dentro de un mismo marco conceptual de una gran coherencia y elegancia.
  • Software
    • R: R es un lenguaje y entorno de programación para el análisis de datos. Se trata de un software libre, distribuido bajo licencia GPL, muy extendido en la comunidad universitaria y que está llamado a cobrar un papel cada vez más relevante en el mundo de las aplicaciones profesionales y de la empresa.
    • Weka: Colección de algoritmos de minería de datos desarrollados en Java e integrados en un entorno gráfico muy atractivo.
    • Orange: Otra colección de algoritmos de minería de datos programados en C++ interconectados con Python. Cuenta también con un entorno gráfico bastante cómodo.
  • Otros enlaces
    • Tipos de interés, probabilidades de fuga y LTV: El primero de una serie de documentos acerca de algunos aspectos relativos al cálculo del valor total (o intertemporal) del cliente, o life time value, que, específicamente, presenta fórmulas adecuadas para el descuento de flujos de caja futuros y establece un puente entre las fórmulas de valoración de clientes y las habituales para valorar activos financieros.
    • Una selección de los artículos publicados en nuestro extinto blog de minería de datos. Estuvo planteado desde una perspectiva de servicio a la comunidad y neutralidad tecnológica y siempre permaneció abierto a todo tipo de colaboración externa. En él se publicó información relevante y significativa sobre nuevas técnicas, métodos y tendencias dentro de la minería de datos, novedades editoriales, evolución y perspectivas de negocio, noticias sobre compañías e institutos de investigación, etc.