Homeopatía de datos

Me mandan un whatsapp. Es de alguien que está en una charla de ciencia de datos. Acaba de oír decir al ponente que en una de esas competiciones de Kaggle le ha servido optimizar a lo largo del conjunto de semillas aleatorias. Sí, del set.seed().

homeopatia_funciona

Supongo que al ponente le funcionaría.

El éxito de la ciencia de datos parece tener aparejada una plaga de homeopatía de datos. Algo habrá que hacer. Por lo pronto, emplear el escepticismo para algo más que para asestar grandes lanzadas a moros muertos.

Un comentario sobre “Homeopatía de datos

  1. antonio 24 noviembre, 2016 17:21

    Sí lanzas el mismo modelo n veces con seeds diferentes y haces una simple media aritmética, tu modelo generalizará mejor.
    Entiendo que el aporte en precisión será mínimo, pero en el contexto de Kaggle, donde las milésimas de precisión cuentan, no me parece tan descabellado.

Los comentarios están desabilitados.