Los siete pecados capitales de la minería de datos

Por ser viernes, traigo a estas páginas un vídeo tan pedagógico como ameno. Es la conferencia de Dick De Veaux dentro la M2010 Data Mining Conference auspiciada por SAS.

El autor repasa los siete pecados capitales de la minería de datos, a saber

  1. No realizar las preguntas adecuadas
  2. No entender el problema correctamente
  3. No prestar suficiente atención a la preparación de los datos
  4. Ignorar lo que no está ahí
  5. Enamorarse de los modelos
  6. Trabajar en solitario
  7. Usar datos malos

Frente a ellas, propone las siguientes virtudes:

  1. Define el problema
  2. Prepara los datos usando conocimiento sobre el campo del que proceden
  3. Mantente dispuesto y preparado para aplicar nuevas ideas y modelos
  4. Ten en cuenta los valores no informados: crea variables derivadas
  5. Trabaja en equipo
  6. Asegúrate de la calidad de los datos
  7. Usa modelos, no únicamente asociaciones

¡Ah! Y que nadie se pierda alrededor del minuto 7:30 el icono que aparece en la esquina inferior izquierda del escritorio del ordenador.