Científicos de datos, aprended de los actuarios

Los actuarios fueron tal vez los primeros científicos de datos. Aparentemente, la primera tabla de mortalidad fue creada por John Graunt en 1662.

Los actuarios hablan de la esperanza de vida. Pero no son tan pendejos como los científicos de datos de hoy en día en eso de pretender que la esperanza de vida es la vida. Los actuarios saben que en una cohorte con una esperanza de vida de 78 años habrá quien muera a los tres, a los quince, a los cincuenta y a los noventa. Nadie les exige que acierten cuándo va a morir cada cual. En lugar de eso, estudian la distribución de los fallecimientos a lo largo del tiempo y calculan indicadores útiles para sus clientes.

Yo creo que ningún actuario sabe qué es el RMSE. Ni falta le hace.

Muchos científicos de datos, igual que los actuarios, trabajan con datos que se refieren a personas: cuánto tardarán mis clientes en volver a entrar por la puerta, cuánto comprarán en los próximos meses, etc. Pero la ciencia de los datos, mucho más reciente que la actuarial, peca del ímpetu y la fogosidad propia de los jóvenes y aspira a acertar individuo por individuo cuánto y cuándo. ¡Ay si no!

La ciencia de los datos madurará y se volverá más como la actuarial. Los científicos de datos tienen, tenemos, mucho que aprender de los actuarios. Entre otras cosas, tenemos que sacudirnos de encima el fetichismo de la precisión. Tenemos que asumir que los seres humanos cuyo comportamiento aspiramos predecir, gozan de albedrío y están sujetos a circunstancias que nuestros modelos de diez variables y siete parámetros no recogen.

Tenemos, en definitiva, dejar de llamar errores a las desviaciones con respecto a nuestras predicciones, asumirlas como fluctuaciones naturales y, como los actuarios, elaborar sobre ellas.

4 comentarios sobre “Científicos de datos, aprended de los actuarios

  1. ffernandez 18 marzo, 2014 10:14

    Amén.

  2. rvaquerizo 18 marzo, 2014 10:43

    Un poco reaccionario. Sólo te falta alabar el COBOL.

  3. Guido 18 marzo, 2014 11:22

    Todas las ciencias requieren una buena dosis de humildad.

    Yo lo entendí explicándolo. Hace un tiempo tuve que realizar pruebas neuropsicológicas a un grupo de personas mayores para una investigación. Tuve que explicarles un millón de veces qeu buscábamos efectos grupales y no individuales… Claro ellos se ponían un poco ansiosos ( (pervirtiendo los resultados…) intentando rendir ‘individualmente’ a tope. Pero es una investigación que no es importante las puntuaciones individuales sino grupales.

    En fin muy buena entra (as usual) , un saludo

  4. José Luis 18 marzo, 2014 14:28

    De acuerdo en parte. Creo que el RMSE es útil, aunque como bien dices hay que relativizarlo. Por ejemplo, a la hora de ver la “precisión” en un modelo logístico, me gusta representar la proporción de éxitos en las categorías de las variables categóricas de interés frente a la probabilidad estimada para esos grupos. Por ejemplo, categorizando la edad y comparando la proporción de “unos” verdaderos en cada categoría frente a la prob estimada. Muy a lo Hosmer-Lemeshow..

Los comentarios están desabilitados.