Estadística descriptiva allende la estadística descriptiva

Este fin de semana me toca enseñar estadística en el máster de data science de la UTAD. Heredo un programa que incluye una sección importante de estadística descriptiva (que pienso subvertir, claro está).

La estadística descriptiva, según la entiendo, va mucho más allá de lo que viene llamándose estadística descriptiva: eso de las medias, las medianas, el análisis unidimensional, etc. Pienso que un modelo estadístico no es sino una evolución natural de esas trivialidades que nos proporciona una comprensión más profunda de los datos: más allá de cómo son las variables una a una, cómo interoperan y de qué manera actúan para determinar uno o varios efectos de interés.

Supongo que en eso discrepo con otra gente más optimista.

Como fuere, después de analizar con detenimiento un modelo estadístico bien construido, uno podría llegar a conocer mejor la población subyacente. Insisto en lo de bien construido y planteado. Porque en lo que sigue voy a despellejar un contraejemplo. Véase, dentro de esto, ese modelo, el segundo, con el que se pretende dilucidar cuáles son las causas que afectan a la celeridad en la concesión de los indultos.

Los autores omiten una variable tremendamente explicativa: el tipo de delito cuya condena se indulta. No hay que ser particularmente perspicaz para darse cuenta de que, según el gráfico que aparece en este estudio de la Fundación Civio, esa variable es muy predictora.

Concluyen los autores del estudio cosas tan peregrinas como que a las mujeres se les indulta más rápido que a los hombres. Y yo digo: ¿y si esa relación se da a través de la distinta proporción en que hombres y mujeres cometen determinado tipo de delitos y la distinta celeridad en que estos conceden según aquel?

Lo siento, pero ese estudio, si aporta algún tipo de información descriptiva sobre el conjunto de datos en cuestión, lo hace de casualidad.

Nota: y no es esa la cuestión más preocupante del estudio. Hay otras como, por ejemplo, el sesgo que puede haber introducido su muy peculiar construcción del universo de datos. Pero esa es otra historia.

3 comentarios sobre “Estadística descriptiva allende la estadística descriptiva

  1. José Luis 8 julio, 2015 10:14

    Para mi, una gran parte de la estadística descriptiva debería ser el análisis exploratorio de datos con especial atención a las representación gráficas. Simplemente con eso, uno va haciéndose una mejor idea de las relaciones existentes entre variables. Y un tipo de modelos que,bajo mi punto de vista, podrían incluirse en la parte de exploración son los árboles de regresión y clasificación.
    Saludos y que te vayan bien las clases este finde.

  2. jbm 8 julio, 2015 12:58

    Entonces habrá que dividir la estadística descriptiva en básica y avanzadai> . Porque una regresión lineal puede ser descriptiva pero antes tendrás que saber lo que es una media.

  3. Carlos J. Gil Bellosta 8 julio, 2015 17:29

    Absolutamente de acuerdo. De hecho, para mi, el primer paso de un análisis descriptivo es library(party) + ctree.

Los comentarios están desabilitados.