Test de Student e importancia práctica: una solución (para su discusión)

El ejercicio que planteé hace unos días está extraído (casi literalmente) de aquí. Veamos cómo razona su autor en cada caso:

  • Caso 1: Existe una diferencia estadísticamente significativa entre los tratamientos. Pero carece de importancia práctica porque es improbable que supere los 3 mg/dl.
  • Caso 2: La diferencia es estadísticamente significativa y tiene importancia práctica a pesar de que el intervalo de confianza tiene una anchura de 20 mg/dl. Y es que un intervalo de confianza ancho no es necesariamente algo negativo: en este caso, por ejemplo, todos los puntos del rango tienen una misma interpretación. El nuevo tratamiento funciona, aunque sea imposible acotar con mucha precisión el rango de mejora.
  • Caso 3: La diferencia es estadísticamente significativa pero puede o no tener importancia práctica. El intervalo de confianza es demasiado ancho: puede ser de tan solo 2 mg/dl; pero también de 58 mg/dl. En este caso sería recomendable continuar investigando el tratamiento.
  • El caso 4 es fácil: no existe una diferencia significativa y, de haberla, es casi seguro que no tendría relevancia práctica.
  • Casos 5 y 6: La diferencia no es estadísticamente significativa. Sin embargo, esta diferencia no está lo suficientemente bien acotada como para descartar la posibilidad de que puedan existir efectos de importancia práctica. De todos modos, en el caso 5 sería más razonable desestimar dicha posibilidad que en el 6, que es parecido al caso 3.

Nuevo curso (gratuito) de estadística con R

R

Hace unos meses, Juanjo Gibaja y yo lanzamos un curso básico de R. Animados por el éxito de crítica y público, volvemos a la carga con uno nuevo. Esta vez el curso se titula Introducción a la estadística moderna con R. Y su presentación es:

La estadística es una disciplina científica joven: la mayor parte de los conceptos básicos de los que se ocupan los libros de texto tienen apenas 100 años.

Reunión del Grupo de Usuarios de R de Madrid

R

El día 31 de octubre (de 2012) se reunirá de nuevo el Grupo de Usuarios de R de Madrid. La reunión tendrá lugar en el Matadero (metro Legazpi) y el programa y otros detalles pueden consultarse, como siempre, en la página del grupo. Y también en la página de Medialab Prado.

Entre otras cosas, casi seguro, se discutirá el plan de reuniones para el curso actual, los temas que se discutirán en las siguientes, etc.

Algunos gráficos de información bursátil

Hoy voy a presentar algunos gráficos de información bursátil adaptados a partir de código de Eric Zivot, el instructor del curso Introduction to Computational Finance and Financial Econometrics que estoy siguiendo (un poco como puta por rastrojo: siempre me las arreglo para resolver los ejercicios en el último minuto y antes de haber revisado la teoría) en Coursera.

Por si pueden servir de algo a otros, los reproduzco y comento aquí. Primero, hay que importar las librerías necesarias:

Los ingleses me descolocan

Los ingleses me descolocan. Hace unos días me enteré de una propuesta de George Osborne, el ministro de hacienda del Reino Unido, que se conoce como shares for rights o acciones a cambio de derechos. Consiste esencialmente en ofrecer a los empleados la opción (nunca la obligación) de recibir una recompensa económica a cambio de que renuncien a una serie de derechos laborales.

Nótese que se trata de una opción. Y tener opciones es bueno. Al menos, para homines œconomici.

R como herramienta de captura de datos

R

Seré breve hoy porque estoy desinspirado. Y también porque estoy trabajando en dos o tres proyectos importantes de los que se hablará por aquí pronto. Así que hoy me dedicaré a divulgar una presentación de Jeffrey Breen que tiene un título engañoso: Tapping the Data Deluge with R.

En realidad, es un repaso (y el código está disponible) de las posibilidades que ofrece R para capturar datos disponibles en línea en diversos repositorios: Banco Mundial, Yahoo, Twitter. Y no solo eso sino también cómo conectarse a bases de datos, leer y procesar correos electrónicos, etc. En definitiva y si se me permite, amorrarse a fuentes de información diversas como paso previo al análisis.

Test de Student e importancia práctica: un ejercicio

Esto de los tests estadísticos junto con un cierto tipo de formación estadística conduce a automatismos que, a menudo, nos cuesta sacudirnos. Tendemos a aceptar y rechazar hipótesis con escaso juicio. Y una de las dimensiones de un estudio que se ignoran en ocasiones es el de la importancia práctica. Que es, tal vez, aquel por el que se propuso la prueba en primer lugar.

Así que voy a proponer a mis lectores un ejercicio (copiado de algún lugar que anunciaré otro día). Les voy a pedir que piensen si un determinado tratamiento contra, por ejemplo, el ácido úrico (en alguna parte del organismo) es efectivo o no. Supongamos que se sabe que una variación de alrededor de 2 ml/dl no tiene mayor relevancia médica en una persona, pero incrementos de 10 ml/dl y más comienzan a tener efectos importantes sobre la salud.

Abenjaldún, el precursor

El otro día, en una reunión madrileña de escépticos, me pusieron sobre la pista de un tal Abenjaldún. Lo presentaron, poco más o menos, como el primer historiador moderno. Nótese que era tunecino de ascendencia sevillana, musulmán y vivió en el siglo XIV.

Los economistas también lo consideran como de su gremio.

Hojeando su opera magna, Introducción a la historia universal, he encontrado dos párrafos muy aprovechables. Hablando de la astrología, dice que (con mi subrayado):

Gráficos en R a la xkcd

Esto fue un reto en toda regla: un megafriqui publicó código en LaTeX para reproducir en dicho entorno gráficos como los que aparecen en xkcd.com, es decir, del tipo de

con el siguiente resultado:

La respuesta por parte de la comunidad de usuarios de R, obviamente, no podía demorarse. Y es

El código puede encontrarse aquí. Y más información sobre el asunto, recomiendo este otro enlace.

Balanzas fiscales y periodismo basado en datos

Dudo al escribir sobre el asunto porque el contexto del artículo que traigo a colación es ajeno al interés de esta bitácora. Pero me ha parecido un ejercicio inigualable de lo que debería ser el periodismo de datos.

El título es sugerente: ¿Cisne negro o pollo del montón? El déficit fiscal catalán en perspectiva. El tema del cisne negro ya ya sido mencionado aquí previamente, aunque mencionarlo en este contextosolo es posible sometiendo el término a una cierta violencia léxica.