Charla: las *-metrías en la práctica de la ciencia de datos: el papel de la teoría

El próximo 8 de febrero daré una charla dentro del ciclo de Data Konferences.

Para la mía han creado el siguiente cartelito:

El resumen que preparé es:

Una de las características definitorias de la nueva ciencia de datos es su desdén por los planteamientos teóricos. Aspira a encontrar estructura en los datos aplicando una serie de técnicas, generalmente muy intensivas computacionalmente, pero omitiendo cualquier planteamiento o condicionamiento a priori. Este planteamiento subvierte el que fundamenta las *metrías (sicometría, econometría, etc.): en ellas, en análisis de datos tiene como objetivo medir (de ahí el nombre) una serie de parámetros presupuestos por un planteamiento teórico previo.
Este conflicto tiene derivadas filosóficas (que, a pesar de su interés, no consideraremos) y otras de índole práctica. Porque gran parte del trabajo real del científico de datos actual sigue el programa de las *metrías, a pesar de las manifestaciones habituales al contrario.
Esta charla quiere poner de manifiesto el valor de la teoría subyacente e ilustrar cómo el quehacer de un científico de datos consiste frecuentemente en medir parámetros establecidos dentro de un marco teórico riguroso a través de una serie de ejemplos prácticos reales.

Los detalles espaciotemporales y otras concomitancias relevantes para los asistentes pueden consultarse aquí.

Un comentario sobre “Charla: las *-metrías en la práctica de la ciencia de datos: el papel de la teoría

  1. Daniel Tor 26 enero, 2018 11:53

    Al final del cartel aparece repetida la frase prácticos reales, posiblemente una errata, no por mucho repetir van a ser los ejemplos más prácticos o reales. Creo, por otro lado, más que desden por la teoría hay un énfasis en las técnicas exploratorias (EDA) para buscar el método que mejor se adapte al problema en cuestión, ya que en las fases tempranas es fundamental buscar las variables o condiciones que mejor reflejan el problema. En este sentido parte del análisis de datos es artesanal. Ciertamente, lass grandes empresas de machine learning buscan vender un producto en la nube que resuelva los problemas automáticamente, pero estos sistemas tienen la limitación de que, sin un estudio previo y sin fase de diseño de experimentos se pierde gran parte de la eficacia. Hoy en día, la teoría no proporciona una información práctica sobre el rendimiento de los sistemas generales y por ello se procede a técnicas de ensayo y error. No obstante cada día hay mayor necesidad de personal muy capacitado/a tanto en la teoría como en la práctica y diseño de soluciones. Es de esperar que tal personal pueda generalizar los resultados que obtengan para el diseño de sistemas de mayor alcance, es decir posiblemente asistamos en un futuro próximo a una unión muy fructífera entre teoría y práctica.

Comenta

Your email address will not be published.

Puedes usar estas etiquetas y atributos de HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">