Hacia la versión 2.0 de CRISP-DM
CRISP-DM, CRoss Industry Standard Process for Data Mining, es un modelo para el desarrollo de proyectos de minería de datos que describe una serie de procedimientos genéricos --a veces, demasiado-- desde un punto de vista de neutralidad tanto en el ámbito de aplicación como de las herramientas empleadas. Aspira a que los proyectos de minería de datos y de predicción analítica sean más eficientes, estén mejor organizados, se gestionen mejor y que, en definitiva, tengan mayores probabilidades de culminar exitosamente.
El origen del CRISP-DM se remonta a 1996, cuando se quiso aquilatar la experiencia acumulada por los primeros proyectos de minería de datos creando unos protocolos generales que facilitasen el desarrollo de nuevos proyectos. La versión 1.0 de CRISP-DM vio la luz en agosto del 2000.
No obstante, desde esa fecha, han aparecido nuevos problemas y requisitos como, por ejemplo:
- La necesidad de estudiar nuevos tipos de datos --texto, contenido virtual, etc.-- y técnicas para procesarlos, analizarlos e integrarlos con los tradicionales.
- La necesidad de integrar los resultados analíticos con sistemas operacionales --como call centers y portales de internet--, sistemas de gestión y procesos de negocio.
- La necesidad de crear sistemas fácilmente escalables y que funcionen en tiempo real.
- La necesidad de hacer accesibles métodos analíticos avanzados a usuarios de perfil no analítico.
- La necesidad de estudiar grandes bases de datos in situ en lugar de exportando datos a servidores analíticos.
- El crecimiento del tamaño de los equipos encargados de desarrollar proyectos de minería de datos y de integrarlos dentro de los procesos de empresas y organizaciones.
Por eso, actualmente, está comenzando el proceso para renovar y actualizar CRISP-DM. ¿Cuándo contaremos con la versión 2.0?
